PaddleSports是飞桨面向体育场景的端到端开发套件,实现人工智能技术与体育行业的深度融合,目标打造“AI+Sports”的标杆案例集。PaddleSports的特色如下:
-
整体采用“5W1H”的产品架构,即:when(什么时间),where(什么位置),who(是谁),what(发生了什么),why(为什么),how(怎么样)。系统梳理人工智能技术在体育行业的研究、应用、落地。
-
AI模型:从精度、速度、集成度三个维度进行性能评测。AI技术不仅是深度学习,同时整理了经典3D建模,SLAM,机器学习,以及硬件集成开发等工作,目标打造软硬一体的“AI+Sports”开发套件。
-
数据:除了各个已有的公开数据集来评测深度模型的性能外,将首次推出SportsBenchmark,力争能够用一个数据集来评测所有算法模型。
-
工具:面向体育场景的工具集,比如标注工具、检测工具、识别工具等,具有All-in-One,AutoRun的特点。
-
应用:涵盖足球、跳水、乒乓球、花样滑冰、健身、篮球、蹦床、大跳台、速度滑冰、跑步等热门的体育运动。
“what”模块重点分析体育比赛画面中呈现的信息,包含:运动、语音、视觉、多模态等:
1)运动属性,从视频前后帧信息推断运动信息,包含2D光流以及3D场景流相关技术;
2)语义属性,包含:图像/视频检索识别,视频动作识别,image/video caption等;
3)视觉属性,包含:画质增强,超分辨率,2D转3D,3D实时交互等;
4)多模态属性,视觉数据与语音数据、文本数据联合分析。
任务 | 技术方向 | 技术细分 | 算法模型 |
---|---|---|---|
4.what | 4.1) 运动属性 | 2D Optical Flow (经典算法) | Horn-Schunck光流法 |
Lucas-Kanade光流法 | |||
Block-Matching光流法 | |||
Dual-TVL1 | |||
DeepFlow-v2 | |||
Global Patch Collider | |||
2D Optical Flow (深度学习) | RAFT (ECCV 2020 best paper) | ||
FlowNet1.0 | |||
FlowNet2.0 | |||
NVIDIA SDK | |||
3D Scene Flow | FlowNet3D | ||
Just Go with the Flow | |||
MotionNet | |||
2D-3D Expansion | |||
4.2) 语义属性 | 图像检索识别 | PP-Lite-Shitu | |
PP-LCNetV2 | |||
视频动作识别 | CTR-GCN | ||
ST-GCN | |||
AGCN | |||
Image Caption | COCO Caption | ||
Im2Text | |||
Video Caption | ActivityNet | ||
OCR | PaddleOCR | ||
4.3) 视觉属性 | 画质增强 | Space-Time-Aware Multi-Resolution Video Enhancement | |
图像/视频去噪 | FastDVDnet | ||
超分辨率 | Super Resolution | ||
图像填补 | Inpainting | ||
2D转3D | NeRF | ||
3D Visualization | Maya | ||
Unity | |||
Unreal | |||
4.4) 多模态属性 | 文本+视觉 | VideoBERT | |
VisualBERT | |||