揭秘冬奥会上的一项AI黑科技,正从神坛走向大众

网优雇佣军 2022-04-13 18:40:05

现代体育赛事是运动员之间争分夺秒的比拼,更是赛场背后各种高科技大比武。近年来,我们看到每届奥运会都有各种新科技亮相,不仅给人们带来了更刺激的观赛体验,而且一次次帮助运动员突破身体极限,生动诠释了“更快、更高、更强”的奥林匹克精神。

以不久前结束的北京冬奥会为例,在速度滑冰男子500米比赛中,中国队以34秒32的成绩打破奥运会纪录,并夺得中国男子速度滑冰历史上的首枚冬奥会金牌,那一刻真是令人热泪盈眶,无比自豪,至今难以忘怀。

这枚来之不易的金牌背后,是运动员日复一日挥洒的汗水,也是教练员们幕后默默的专业指导和鼓励。但你可能不知道的是,这背后还有一项AI黑科技的功劳,它一次次精准地帮助运动员们调整细微技术动作,大幅提升了训练效率和质量。

简单易用的“AI教练”

在过去的体育训练模式中,教练全靠肉眼观察运动员的表现,并凭借经验反复对运动员的动作细节进行调整、纠正,没有客观、具体的量化数据分析,欠缺训练针对性和效率。最近二十年来,为了精确了解运动员的体能状况、动作细节以及分析对手风格、预测战术等,数据科学逐渐被引入到体育运动中。随着体育运动越来越依赖数据驱动,为了更好的收集数据,利用可穿戴设备收集运动员的运动数据成为一种常见方式。但这种方式的弊端是显而易见的,将传感器放置在高速奔跑的短跑、速滑等运动员的身体关键部位,不仅可能会干扰运动员的运动过程,而且成本较高。

那有没有一种更简单易用的方法来收集并精准分析运动数据?英特尔®3DAT运动员追踪技术正是在这样的背景下应运而生的技术。据悉,从去年冬季开始,中国速度滑冰队已在日常训练中采用了这套技术系统。

以速度滑冰为例,该项目训练和比赛场地空间范围大,赛道一圈大概400米,且运动员的运动速度很高,动作幅度很大,如果每个运动员都采用可穿戴设备采集数据,必然会给运动员增加额外的负担。同时,速度滑冰是一项技术性很强的体育项目,一个轻微的技术动作处理不当可能就会影响整个比赛结果,这要求动作捕捉系统能实时、精准生成可视化、量化的数据,以供教练和运动员参考。

而3DAT首先可以通过摄像机甚至智能手机来获取训练视频样本,无需运动员佩戴可穿戴设备,无疑为获取运动数据开辟了一条简单、轻量的路径。更重要的是,其基于机器视觉和AI技术,能从拍摄的标准视频中提取运动员的骨骼和肌肉形状及运动轨迹,重建运动员2D及3D骨骼的运动姿态及轨迹模型,并生成生物力学数据,从而能让教练和运动专家们精准地评估运动员在运动时的身体状态,并进行更有针对性的指导。

具体而言,在速度滑冰项目中,起跑和直线加速阶段是影响运动员成绩的关键,也是教练员最关心的重点。在起跑阶段,3DAT技术通过机器视觉和AI技术从视频画面中抽取和识别人体和人体关节点,生成2D骨骼,再利用场地、相机参数等信息重建三维运动姿态,并能通过生物力学算法计算出双脚与起跑线的夹角、双腿蹲屈的幅度、双臂的位置、重心摆放等起跑姿势参数集,以及包括步频、蹬冰时间、悬空时间、地面时间、膝关节角速度、起跑角速度等各种起跑后的参数集,从而让教练和运动专家们既能多视角回放观看运动员的动作和姿势,也能通过量化数据精准分析起跑姿态对速度的影响。

在直线加速阶段同理,教练和运动专家们可通过3DAT生成的核心关节、膝关节、髋关节的旋转角度和角速度,以及运动员的质心的轨迹和加速度等数据,帮助运动员分析姿态对蹬冰质量和效率的影响。

实时精准的技术底座

简单易用的背后,通常是绝对不简单的底层技术。不难理解,图像包含的信息量是巨大的,要从连续多帧的视频画面中逐层提取出肘、踝、膝、肩关节等关节点的位置信息,对计算能力的要求是非常高的。而在平时训练中,教练员往往要求即时采集、即时生成数据,以即时调整技术细节,这对计算能力和AI算法又提出了更高的要求。

据悉,3DAT技术不仅支持1080P、4K等画质,还能以160fps的帧速率解码,支持多路视频的同步采集以及多路视频在后续数据处理过程中的同步处理、多路视频生成3D姿态数据等;并能实现高精度数据生成,测量误差可低至5毫米级别,角度误差可控制在7-8度左右;在实际应用中,还可在训练现场即时生成3D数据和生物力学数据。

那这些能力背后有着怎样的底层技术支撑呢?

首先,英特尔®至强®可扩展平台可实时处理、校验、统计和分析复杂而庞大的训练数据信息,确保了3DAT系统的及时性。

第三代英特尔®至强®可扩展处理器相比上一代产品性能提升高达46%,支持8通道DDR4/3200, 64条PCI EXPRESS 4.0通道,全面增强I/O吞吐量,为信息量巨大、实时性和精准度要求高的图形、影像处理和3D建模、数据分析,提供了坚实的基础。英特尔®傲腾™ 技术提供充足的数据存储容量的同时,可凭借低时延特性确保数据处理效率。英特尔®Scalable Video Technology可在不损失图像质量的前提下大幅提升视频编码效率,从而能确保视频播放和报告生成的低时延。

其次,3DAT基于英特尔OpenVINO视觉工具套件进行开发,基于英特尔®至强®集成了AI加速技术,能让视频数据读取、预处理、缺失帧修复、运动数据生成等图像处理更精准、高效,测量达像素级精度,也显著提升了深度学习推理和训练的性能,能让模型生成更高效、更精准,推理执行速度大幅提升。

此外,3DAT还具有易部署、易实施的特点。基于云/边、端协同,通常在现场只需部署2-4台摄像设备,甚至在条件有限的情况下采用随身携带的智能手机,就能采集视频样本,再将视频上传到云端/边缘,通过基于英特尔至强处理器的服务器进行高速处理,可近乎实时地向教练和运动员反馈分析结果。

走出奥运,普惠大众

简单的讲,3DAT技术最显著的特征就是通过机器视觉和AI算法替代了那些放置于运动员身体上的传感器,具备简单易用、采集范围大、易部署等优势,并基于英特尔®至强®可扩展平台可实现实时、精准的数据分析处理,从而降低动作捕捉技术的门槛。而由于AI模型可扩展可训练,它还易于移植到更多体育比赛项目,以及艺术表演、健身、运动康复等广泛的领域,进而走向普惠大众之路。

比如在北京冬奥会开幕式上的《致敬人民》和《雪花》两个节目中,英特尔基于3DAT技术,联合第三方专业团队定制开发了“基于人工智能技术的演出实时特效系统”,通过高效部署多个人体检测AI模型和算法调整,仅用4台摄像机就完成了上百名演员的精准人体识别,及大范围内的人体精准定位,并实现了从图像采集、识别、检测到处理全过程不到几十毫秒的端到端时延,最终打造出现场屏幕与演员位移实时互动的效果,为观众呈现了一场科技与艺术完美融合的视觉盛宴。

不难想象,既然这项技术能应用于冬奥会训练和开幕式表演这样的顶级场景,自然将其下沉应用于健身、运动康复等领域也不在话下。比如,健身教练可随时随地将学员的训练视频上传到云端,即时获取生成的3D骨骼和相关数据,为学员提供正确的锻炼方式指导;俱乐部或教练员可通过收集的视频数据来评估球员的技能和运动潜力,以低成本、高精准的方式进行运动员选材。进一步扩展想象, AR/VR系统的一个重要组成部分是重建用户的3D姿态,3DAT自然能与AR/VR技术结合,为我们打造出各种全新的沉浸式、互动式娱乐体验,甚至加速推动虚拟世界和现实世界的无缝融合,助力人类迈入元宇宙时代......

值得一提的是,为了让更多项目能使用到这一技术,更好的赋能产业,英特尔还与AWS合作部署了3DAT Cloud SDK,通过开放API可让开发者、使用者、ISV伙伴们根据自身不同需求,在AWS云上快速实现二次开发和应用部署。相信这将进一步加速该技术普及,为未来的体育训练和比赛乃至更多的领域带来更大的变化。

0 阅读:15

网优雇佣军

简介:聚焦ICT,关注通信、科技和移动互联网