乒乓球动作智能指导教练
人工智能学院
Table Tennis Action Intelligent Guidance Coach
随着物联网、社交网络、云计算等技术不断融入我们的生活以及现有的计算能力、存储空间、网络带宽的高速发展,人类积累的数据在互联网、通信、金融、商业、医疗等诸多领域不断地增长和累积。互联网搜索引擎支持的数十亿次web搜索每天处理数万TB字节数据。全世界通信网的主干网上一天就有万TB字节数据在传输。大型商场遍及世界各地的数以千计的门店每周都要处理数亿交易。现代医疗行业如医院、药店等也都每天产生庞大的数据量如医疗记录、病人资料、医疗图像等。数据的量级不断升级、应用的不断深入和大数据不可忽视的价值让我们不得不探索如何才能让我们更好的受益于这些数据。大数据是一次对国家宏观调控、商业战略决策、服务业务和管理方式以及每个人的生活都具有重大影响的一次数据技术革命。
目前,在体育训练过程中,大部分采用教练现场进行观察训练动作并给予实时指导的方式进行,或者采用录像设备,保留训练的原视频,而后在训练完成后,教练再根据视频和问题进行纠正和指导,大多数训练人员只能靠自己的判断和收获再去训练,从而使得训练的效率大大降低,因此许多教练希望通过开发大量数据和智能技术来提高训练的效率与质量。在这样一个大数据的环境以及广大教练的需求下,基于OpenPose技术的逐渐成熟,智能教练应运而生。
OpenPose是基于卷积神经网络和监督学习并以caffe为框架写成的开源库,可以实现人的面部表情、躯干和四肢甚至手指的跟踪,不仅适用于单人也适用于多人,同时具有较好的鲁棒性。可以称是世界上第一个基于深度学习的实时多人二维姿态估计,是人机交互上的一个里程碑,为机器理解人提供了一个高质量的信息维度。在此基础上,我们可以通过对教练以及选手的动作的捕捉,制造出一个可以为选手进行训练指导的乒乓球吗智能教练系统。
首先对标准动作的视频数据切割处理,对视频剪辑得到一个完整的动作或招式片段,然后将招式中部分动作截取生成关键帧图片,作为对照数据。再将练习者的动作视频做同样处理,截取其相同动作的关键帧,用来与对照数据比对。再使用Python 开发一个脚本程序,主要实现输入几张关键帧图片,调用OpenPose计算出图片中人体18个关键点坐标、还原骨架、计算关节间角度值的功能。运行后程序会自动将预先截取好的练习者动作关键帧进行处理,得出此画面中包含多个关节角度的人体骨架数据。同时,画面中的人体会被标注出含有关键点的骨架结构。之后,将输出的数据与事先已用同样方法处理过的标准动作数据进行比对,即可大致判断出训练者的动作是否规范。
总之,通过三维运动捕捉数据,在数学、人体解剖学、力学、计算机图形的基础上,记录人体动作。将这些动作切分为可以用符号记录的元素动作,包括支撑动作与非支撑动作,然后分析出每个动作的符号进而绘制成动作图谱。利用运动捕捉数据绘制动作图谱,可以完整准确的记录人体的运动状态。通过多次对于不同动作的演示以及结果分析,将图谱的不同之处与结果的优劣相结合,大数据分析得出初步结论并且通过后期动作演示来探究结论的合理性,不断纠正运动员姿势,从而达到更高成绩的目标。