综述:基于视频的无标记运动分析在研究世界级运动表现中的潜力解锁

《Journal of Sports Sciences》:Unlocking the potential of video-based markerless motion analysis to study world-class sporting performance

【字体: 时间:2025年10月30日 来源:Journal of Sports Sciences 2.5

编辑推荐:

  本综述系统探讨了视频无标记运动分析(VBMMA)技术在竞技体育领域的应用前景。文章对比了传统标记式运动捕捉(如Vicon系统)的局限性(如标记点放置误差、软组织伪影、霍桑效应),重点分析了VBMMA通过计算机视觉(如OpenPose、DeepLabCut、HRNet等算法)实现非侵入式三维运动学(3D kinematics)分析的优势。作者提出以网球为例,结合现有赛事基础设施(如Hawk-Eye系统),通过优化相机配置、增强训练数据集(如Panoptic、Human3.6M)的解剖学标注精度、增加关键点检测数量等软件优化策略,可突破传统生物力学研究的壁垒,为精准评估世界级运动员的竞技表现提供新范式。

  
摘要
长期以来,由于三维标记式运动捕捉系统的限制,运动生物力学家难以在比赛中接触和评估世界级运动员的技术。令人鼓舞的是,基于视频的无标记运动分析的出现为在比赛中非侵入式地捕捉运动表现提供了机会。本文叙述性综述探讨了无标记系统从类实验室分析到比赛分析的进展。它首先探讨了无标记运动分析在动态和运动动作中关节运动学的准确性。接着,探讨了其在比赛中的实用性以及验证这些比赛设置的方法。现有的比赛设置为骨骼跟踪提供了可行基础,但仍需严格验证。本文提出以网球为例,其当前的比赛基础设施可能支持高保真度的运动分析。除了已大量投入的先进硬件(即相机配置)外,计算机视觉研究中提出的软件优化方法(即提高数据处理效率,通过解剖学精确标注和运动特定数据来扩展和优化训练数据集,增加检测的关键点数量和类型)有可能提高其在比赛分析中的准确性。最终,在现实世界约束下经过严格验证的无标记系统可以弥合接触和评估世界级运动表现之间的差距,服务于运动生物力学。
引言
以适当的生物力学为基础的技术,在影响运动成功和降低受伤风险方面发挥着重要作用。运动员投入无数时间完善技术,以期在比赛中达到巅峰表现。像撑杆跳高运动员阿曼德·杜普兰蒂斯或网球运动员拉斐尔·纳达尔这样卓越的运动员偶尔出现,不断打破纪录,让观众、教练甚至同行竞争者想知道是什么让他们与众不同——这是运动生物力学家经常提出的问题。为了寻求答案,生物力学家通常使用光学标记式运动分析(当前的标准方法)来评估三维技术。尽管其精度很高,但由于涉及的后勤工作(如在参与者身上粘贴标记点以及需要足够近距离放置相机),其在比赛中的使用是不可能的。无标记运动分析的出现为 unobtrusive 地接触比赛表现,特别是世界级运动员的表现提供了机会。其准确性虽然随着技术进步而迅速提高,但仍存在争议。在涉及离散动作的运动中,如标枪投掷、篮球罚球和棒球投球,单次执行可以决定胜负,使得在该次捕捉中进行精确测量至关重要。本叙述性综述探讨了基于视觉的无标记运动分析的准确性,以及它如何用于弥合接触进而评估世界级运动表现之间的差距。
标记式运动分析技术
三维运动分析的标准方法,标记式运动捕捉,涉及围绕一个校准的捕捉空间放置多个光电相机,以跟踪和重建放置在特定解剖标志上的反光标记点的位置和轨迹。这种三角测量过程能够推断三维骨骼姿态,便于研究时空关节运动学。它在重现刚体上标记点的三维位置方面高度精确,对于移动物体的均方根误差小于2毫米,对于静止标记点为1毫米。然而,当反光标记点放置在人体上进行运动分析时,会出现几个误差源,例如软组织伪影和标记点放置过程中的人为误差。数据过滤、逆运动学优化和建模方法的使用已被推荐用于最小化这些误差。尽管有这些策略,与被认为是金标准的双平面视频射线照相法相比,标记式运动捕捉在关节中心位置上的误差仍可达28毫米,中位误差略低于19毫米。脚部骨性标志点的误差范围为3-7毫米。各关节的平均关节旋转误差在2.2°到5.5°之间变化,偶尔会出现更高的误差,例如髋关节内外旋(长轴旋转)误差高达21.8°。尽管与金标准测量存在这些偏差,标记式运动捕捉仍被广泛接受为评估运动中动作的标准测量方法,因为它允许捕捉更大的空间体积。然而,由于需要在参与者身上粘贴物理标记点,其在比赛中的实用性受到限制。标记点的放置可能引起霍桑效应,导致数据偏差,可能无法代表运动员在比赛中的典型表现。对真正世界级表现者的分析仍然非常困难,通常仅由训练有素或精英级表现者代表。这就引出了一个问题:“在比赛中,真正的世界级技术是什么样的?”
无标记运动分析技术
随着计算机视觉、机器学习和数据处理能力的快速发展,出现了几种基于视频的无标记运动分析方法。该技术旨在通过消除以下方面来克服标记式运动分析的局限性:1) 人为误差,2) 软组织伪影,3) 参与者准备时间,4) 霍桑效应,以及5) 冗长的数据处理。这使得 unobtrusive 的实验室外运动分析成为可能,提高了所研究表现的生态效度。在多相机设置中,相机围绕捕捉空间放置、校准和同步,通过2D姿态估计来记录和确定3D关节位置。这些姿态估计算法,通常由深度学习驱动并在特定数据集上训练,使用图像识别从每个相机视角识别关节位置。记录后,多个视图进行匹配,然后进行三角测量以重建3D关节位置和骨骼姿态。随后的数据过滤和优化过程(例如,逆运动学优化)细化3D骨骼姿态,减少误差,并计算关节运动学。虽然单相机设置是可能的,但用于3D运动分析的多相机设置由于增强了深度信息而具有更高的准确性——3D关节位置可以通过使用多个视图进行三角测量来计算,而不是从单视图估计——并且受益于多个视角减少的遮挡。值得注意的是,目前大多数研究以类似于标记式替代方案的方式利用无标记运动捕捉系统,将相机靠近参与者放置以捕捉详细动作,但牺牲了捕捉空间。具有讽刺意味的是,无标记运动捕捉系统用于运动分析的关键优势是其能够在实际比赛中 unobtrusive 地捕捉运动员。然而,要实现这一点,相机必须放置在比赛场地(即足球场、网球场、棒球场等)周围更远和更高的位置,这无意中降低了图像中感兴趣主体的细节粒度,而这对计算机视觉任务的准确性很重要。这就引出了一个问题:“无标记运动捕捉在比赛分析中的准确性如何?”
近距离分析的准确性
无标记运动分析的快速发展催生了几种开源姿态估计工具包和模型,如 AlphaPose、DeepLabCut、HRNet、MMPose 和 OpenPose。尽管体育科学研究和验证研究经常使用 OpenPose 和 HRNet,但这些模型后来被 MotionBERT、MotionAGFormer、MVGFormer 和 ViTPose 等模型超越,后者又挑战了先前认为无标记运动分析达不到运动生物力学和临床实践所需的准确度和精度基准的观点。然而,在开发姿态估计模型的开发者和运动生物力学家之间仍然存在差距——后者优先考虑特定关节瞬时运动学的准确性,而前者优先考虑整个运动的平均准确性。这从验证研究中呈现的评估指标类型中可见一斑。这些指标主要包括:1) 平均每关节位置误差(单位:毫米),代表整个感兴趣运动中预测的和真实关节坐标之间的3D欧几里得距离;2) 关节角度、事件时间或关节位置的平均绝对误差(或均方根误差,通过对较大误差进行平方来惩罚它们),代表预测值和真实值之间的绝对差异,通常在整个运动范围内平均。对于运动生物力学家来说,基于波形的评估指标可能更具信息性,这些指标考虑了整个运动持续时间内的空间(错误)对齐。这些包括:1) 多重相关系数(得分0-1),表示特定变量(例如,关节角度或位置)的时间序列波形在系统之间的重复试验的相关程度;2) 多重判定系数(得分0-1),是前者的平方值,代表一个波形的方差由比较波形解释的百分比。标记式运动分析和手动数字化通常用作这些验证的参考真实值。
当报告每轴(即X、Y或Z轴)的平均绝对误差时,Nakano等人发现47%的误差小于20毫米,80%小于30毫米,而10%大于40毫米。他们将高误差率归因于不正确的检测(例如,将左膝误认为右膝),而不是跟踪不良,并建议纠正此类错误的算法可以将总误差降低到30毫米以内。相比之下,Needham等人观察到各种无标记姿态估计模型(即OpenPose和DeepLabCut)与标记式系统之间关节位置的系统性偏移,前者产生更靠下和靠外的髋关节中心以及更靠下的膝关节中心。研究下肢运动学时,Kanko, Laende等人报告了髋部位置和所有关节长轴旋转的较高均方根误差(膝和踝小于25毫米,髋小于36毫米;所有屈曲/伸展和外展/内收为2.6°至11°,所有内旋/外旋为6.9°至13.2°)。Song等人研究了从日常活动到锻炼运动的八种运动,报告踝和膝关节角度的均方根误差小于5.9°,髋关节角度误差小于15.9°;具体来说,在跑步和跑动急停等快速运动期间,髋关节角度误差较高。反映了该领域的持续进展,Walker等人最近表明,在检测跨步速范围(从3到12公里/小时)的下肢关节运动学变化时,两个系统在矢状面波形相似性方面大多表现出色(多重判定系数≥0.87)。下肢关节的最小系统性偏移也被报道。在这些最新发展中,Antognini等人应用了一个最近提出的框架(Ortigas-Vásquez等人提出的参考帧对齐方法(REFRAME)),改善了无标记和标记式膝关节运动学之间的一致性。通过重新定向股骨和胫骨的坐标系以改善两个系统局部参考帧的对齐,减少系统性差异,作者报告膝关节角度的均方根误差从矢状面的3.9°降至1.7°,额状面的6.1°降至1.7°,横断面的10.2°降至2.5°。总体而言,髋关节 consistently 产生最高的误差,可能是由于识别髋关节中心的相关挑战,因为衣物会扭曲特征检测。
在少数研究较快上肢运动(即过顶投掷、拳击和网球)的研究中,肘部 consistently 显示出比其他上肢关节更高的位置(3D欧几里得距离误差:≤ 47毫米)和角度(平均绝对误差:小于19°;均方根误差:小于23°)误差。有希望的是,Fleisig等人报告了在棒球投球过程中,他们的标记式和无标记系统之间的关节运动学具有极好的相似性,具有非常高的多重相关系数(0.88 - 0.97)。尽管波形一致,但观察到了系统性差异,作者将其归因于“系统之间的根本差异,使得几乎不可能实现完美匹配”。这些结果表明,无标记运动分析可以提供有关运动模式的有价值的见解,即使它与标记式运动分析数据不完全一致。此外,每个模型(即无标记与标记式系统)中肢体段(例如骨盆)定义方式的细微差异可能导致运动学输出的系统性偏移,但两者在各自的定义范围内可能同样准确。Kanko等人同意这些观点,当他们手动修改标准的标记式骨骼模型——以更好地将标记式局部段坐标系与无标记式对齐——发现关节运动学差异减小,系统间一致性更好。最近,除了运动和步态中存在的较大运动范围外,无标记运动分析在分析姿势控制运动中也显示出相当的准确性,强调了其检测更细微运动的潜在敏感性。鉴于标记式运动分析与金标准测量(如双平面视频射线照相法)相比已知的不准确性,使无标记和标记式系统结果对齐的必要性受到质疑。相反,有人提出应为无标记运动捕捉建立系统特定的参考范围。为此,无标记系统在步行(小于3°)和跑步机跑步(小于2°)方面显示出比标记式系统(3.0 - 3.6°)更低的会话间变异性,表明其在多次会话中的可重复性,并支持使用无标记运动捕捉,因为它有潜力克服会话间标记点放置的变异性。
基于视觉的无标记运动分析通过消除对物理标记点的需求并允许参与者穿着常规运动服,实现了生态效度高的比赛分析。然而,在运动员穿着宽松服装时识别关节中心位置的准确性尚不明确。一些步态研究报告称,衣物对关节运动学的影响很小或没有临床意义。最近的比较表明,无标记运动分析在会话间和衣物条件(即紧身与宽松服装)之间的变异性(小于5°)与标记式系统在标记点放置过程中观察到的评估者间变异性(5°)相当。相反,对特定运动动作的研究——如涉及快速横向移动的滑雪,或包括快速动态动作的板球投球——表明宽松的服装及其惯性可能导致不准确的关节中心检测,即使在手动人工标注中也是如此。这突显了无标记运动分析的一个关键挑战,即动态运动动作结合宽松服装会阻碍姿态估计和数据集训练,对人类和机器都构成困难。
在比赛中的实用性
虽然基于视频的无标记运动捕捉系统在比赛中的应用并非新事物,但其能力直到最近才发展到更精细的分辨率分析,如人体姿态估计。应用包括物体(例如球)跟踪和轨迹预测、运动员质心跟踪、比赛阵型识别、事件和动作识别、视频摘要以及骨骼跟踪。该技术于2001年首次引入用于板球中的球跟踪,后来于2006年在职业网球锦标赛中采用。对于网球轨迹跟踪,报告的平均误差在2.6毫米到3.6毫米之间,完全在官方电子线审可接受的误差范围内。对于单点球员质心跟踪,在像足球场这样的大面积比赛区域上报告了80毫米的误差。这允许分析比赛策略和阵型、球员-物体互动以及场上移动模式。在人体姿态估计下,骨骼跟踪(即关节跟踪)服务于多种目的:增强广播图形以改善观众体验(例如,逐场比赛摘要提要、评论员讲故事、视频上数据叠加)、改进裁判(例如,使用关节级位置进行足球半自动越位检测),以及实现生物力学分析以获得更深入的性能洞察。这些应用在准确性要求上各不相同。用于增强广播的动作和事件识别可以容忍一定程度的噪声;裁判工具已在正式比赛中使用,并显示出与人工裁判的高度一致性;然而,生物力学分析需要极高的数据准确性才能做出有意义的解释,但尚未得到完全验证。尽管如此,如果经过验证并证明准确,这些系统将允许在网球、篮球、棒球、足球、橄榄球和武术等多种运动中实现及时和深入的游戏分析。更重要的是,对于关注关节运动学和技术分析的运动生物力学家来说,这项技术对于弥合接触和评估世界级运动员表现之间的差距至关重要。
尽管最近的出版物显示出前景,但基于视频的无标记运动分析系统是否已达到运动生物力学所需的精度水平仍存在争议。这主要是由于运动动作的复杂性,带来了多重挑战。这些包括:1) 训练数据中缺乏解剖学精确的标注,2) 高度多样化和运动特定的动作需要更大、更多样化的训练数据集,3) 依赖稀疏的关键点(主要是关节中心),这限制了对长轴(例如内外)旋转的准确确定,4) 复杂动作过程中的遮挡,以及5) 快速运动期间帧率不足和运动模糊。在比赛期间,额外的考虑因素包括6) 由于更宽的视野导致感兴趣对象的像素分辨率降低,以及7) 宽松的服装妨碍了可靠的姿态估计特征检测。
比赛场景的验证
验证基于视频的无标记运动分析系统用于比赛,特别是用于3D关节运动学,并非易事。首先,也是最重要的,系统必须可配置且能够 unobtrusive 地捕捉整个比赛区域(或技能表现),相机放置得足够远以避免干扰赛事,但又足够近以保留足够的图像细节进行准确分析。其次,验证本身需要一个标准比较器。一种选择涉及手动数字化结合3D直接线性变换以获得3D关节数据。这种方法多年来已有效地用于比赛中收集各种运动的世界级运动员数据。尽管手动数字化耗时且容易偶尔出现人为误差,但它已显示出关节位置和质心估计的低均方根误差(小于0.01米),关节角度的相对和绝对误差小于1°,关节角度波形的多重判定系数为0.99,以及数字化肢体段长度的评估者内和评估者间信度小于0.02米。此外,由于它不需要物理标记点并且可以随时部署,手动数字化仍然是验证比赛中或现场姿态估计算法的首选方法,并且经常用作训练无标记姿态估计模型的真实值。
据作者所知,迄今为止只有两篇论文验证了无标记运动分析在真实世界比赛中的性能。有人提出,无标记运动分析系统的开发者通常要么对执行稳健的验证不感兴趣,要么不愿公布验证结果,他们可能更不愿意在真实世界的竞争环境中进行验证。在两篇论文中,Cronin等人在2017年世界田径锦标赛期间使用两台高速(每秒200帧)视频相机验证了OpenPose(一种基于多阶段卷积神经网络的开源人体姿态估计算法)。结果显示,OpenPose与手动数字化在关节角度(多重判定系数:0.21 - 0.52)和质心位置(多重判定系数:0.19 - 0.71)方面的一致性为差到中等。对于关键变量如起跳角度,一致性界限特别宽(-34.63° - 9.76°),导致作者得出结论,OpenPose“不允许对运动进行有效量化”。然而,作者承认OpenPose并非为高保真生物力学分析而设计。其训练数据并非由具有解剖学知识的专家标注,并且尽管包含广泛的训练图像库,但可能缺乏像跳远起跳这样的运动特定动作,使得准确的姿态检测更具挑战性。Zw?lfer等人通过使用由具有解剖学知识的专家标注的滑雪者特定训练数据集对AlphaPose的更通用HALPE26模型进行微调,解决了这些局限性。尽管仅使用八台相机覆盖一个250米 x 80米 x 20米的空间,他们在分析高山滑雪时报告了对比鲜明的结果。他们重新训练的滑雪者特定模型产生的平均段长差异(0.2 - 2.3厘米)大多在典型测量误差(约2厘米)之内。此外,他们的模型在段长方面显示出比手动数字化更低的变异性(平均标准差:3.4厘米 vs 4.6厘米)。作者得出结论,他们的滑雪者特定模型和运动捕捉管道在3D关节重建方面表现良好,可以支持户外运动生物力学研究的扩展。
拟议的验证设置
另一种方法涉及针对3D标记式标准验证现有的比赛无标记运动捕捉设置(例如BOLT6和Hawk-Eye)。网球是一个有前途的例子,其中使用现有无标记运动捕捉系统进行骨骼跟踪可能提供早期机会,弥合接触和评估世界级运动员表现之间的差距。网球场与足球或棒球场相比相对较小,并且当前技术已在物体定位方面展示了毫米级精度,从球跟踪结果可见一斑。尽管系统的验证目前仅限于3D标记式标准的捕捉空间,但向后者设置添加更多相机会扩大捕捉区域。验证无标记运动捕捉系统用于分析运动中特定技术(例如,发球、击落地球或截击)的不同阶段可能更可行。一旦选择了要分析的技术,标记式运动捕捉系统的相机可以放置在场上以捕捉整个运动空间,而不会阻碍放置在更远处用于比赛分析的无标记运动捕捉系统的相机;类似的比较和设置已为足球进行过。为了确保结果的可比性,同时在生态有效的方式下正确验证系统,参与者应穿着其常规比赛服装。作者建议根据所使用的标记集模型粘贴反光标记点,然后在参与者所穿服装上剪洞,让标记点从衣服中突出。这确保了标记式系统可以检测到标记点进行分析,而无标记系统仍然必须检测通常被衣物覆盖的关节中心。然而,问题仍然存在:考虑到无标记和标记式运动分析之间的固有差异,它们的数据应该对齐到何种程度?或者,利用后者来训练前者的姿态估计算法是否更有效?
比赛中网球运动分析潜在的成功因素和考虑
商业公司(例如BOLT6和Hawk-Eye)已经在用于比赛电子线审的先进硬件基础设施上投入了大量资金。这确保了捕捉高分辨率、多视角视频,这对于无标记运动分析以及应对前述运动动作带来的挑战至关重要。此外,它们将已建立处理管道,确保接近实时的数据反馈,这是“实时”线审所必需的。现在的关键因素在于软件开发,这是每家公司的专有技术,最终决定了数据的准确性。
相机:捕捉参数
相机捕捉参数如帧速率、快门速度和图像分辨率会影响视频清晰度,确保时间敏感细节(例如,球拍-球接触的确切瞬间)被准确捕捉。更高的帧速率和图像分辨率会产生大量需要更长数据处理时间的原始数据,但对于捕捉动作执行的关键时刻至关重要。即使在较高帧速率下,如果快门速度不够高,网球发球期间快速移动的关节(如手腕)也可能出现模糊,因为每个快门周期会捕捉到更多运动。然而,提高快门速度会减少进入图像传感器的光量,导致图像更暗、对比度更低,这对姿态估计算法的性能产生负面影响。幸运的是,户外日光和夜间比赛中使用的泛光灯比大多数室内实验室照明要亮得多。
相机:质量
先进的相机技术允许捕捉更高分辨率的图像,这在相机放置较远时尤为重要。这种更高的分辨率为特征检测提供了更多像素,从而实现更精确的关节定位。除了硬件能力之外,超像素分割等先进方法——基于物体形状和边界对相似像素进行分组——可以提高将感兴趣对象(即球员及其肢体)与背景分离的精度。这有助于改善身体部位的识别,尤其是在光线条件不断变化的户外。此外,已经提出了基于Swin Transformer的双重聚焦网络用于图像超分辨率,以增强和锐化图像,无论其原始分辨率如何。这种方法使物体更加清晰,尤其是当视野中的主体较小时。结合一个跨帧时间学习模块,该模块参考相邻帧的相关信息来细化当前帧的预测,有助于减少快速运动期间运动模糊引起的误差。
相机:数量
通过在球场周围放置多个相机,可以减少自遮挡,并增强用于估计3D关节位置的深度精度。额外的后处理方法,如多视图融合和加权最小二乘算法(该算法降低被遮挡相机视图的优先级),有助于细化数据。解缠关键点检测等技术(该技术模拟关节之间的关系以更好地预测其在遮挡下的位置)以及上述的跨帧时间学习进一步减少了遮挡的影响。类似地,最近He等人提出了PoseTrackNet,一个姿态估计管道,以在具有潜在遮挡的快速运动期间提高关节跟踪的稳定性和平滑性。他们的管道包括姿态校正模块(利用先前帧的姿态信息并更重视可靠的关节)和Deep SORT(应用卡尔曼滤波),以确保预测输出具有更好的时间一致性。
毫无疑问,拥有更多以更高分辨率和帧速率捕捉的相机可以提高无标记运动分析数据输入的质量。然而,必须在最佳相机配置设置和可接受的精度水平之间取得平衡,以在比赛期间保持接近实时的数据处理和反馈。提高软件计算效率有助于减少处理时间。已经提出了几种通用策略来提高人体姿态估计模型的计算效率,包括:1) 仅保留基本连接并将精度从连续值降低到离散值,2) 在已建立的关系上训练模型而不是原始真实标签,3) 自动选择最优神经网络架构,以及4) 将面向性能的模块集成到极简基线网络中,使其轻量级但目标明确。值得注意的是,像BOLT6和Hawk-Eye这样的商业公司可以利用其广泛的专用系统,该系统包含最初为电子线审设计的十到十四台相机,用于人体姿态估计。然而,便携式无标记运动捕捉系统必须使用更少的相机(例如,五到八台,类似于手动数字化工作)运行,同时保持可接受的精度以确保可部署性。
训练数据集:多样性、特异性和标注准确性
一个多样化且运动特定的训练数据集对于提高姿态估计算法的准确性至关重要。已经部署在职业网球比赛中的无标记运动捕捉系统可以轻松收集大量的多视角视频。这为创建网球特定训练数据集提供了坚实的基础,该数据集包含大范围的运动员特征(即,人体测量学和运动风格),随后可以对其进行标注。这种独特的比赛视频集合来自职业球员(即分析的确切目标人群),反映了高质量的运动模式,通常涉及极端姿势,这些姿势很难由新手复制,更不用说旨在创建自己版本运动特定数据集的研究人员了。
除了这些动作的特异性之外,解剖学上精确的标注对于确保准确的姿态估计同样重要。最直接但耗时的解决方案是让具有熟练解剖学知识的标注员手动标注每个视频。最近,出现了使用合成训练视频的新方法。Mundt等人从3D标记轨迹数据合成了2D视频,创建参与者的数字3D表示,可以重新生成各种2D视图,用作姿态估计模型的训练数据。除了训练数据集中视频的数量之外,源自3D标记数据的关节位置的解剖学精度确保了高质量。他们的方法报告了八个关键点(即左右髋、膝、踝和脚跟)的欧几里得距离误差小于4毫米。将合成数据更进一步,Tong等人使用Unreal Engine的虚拟环境完全从高度逼真的动画创建了一个新颖的多视图训练数据集(即RunningPoseEval)。这种方法的优势在于可以访问其动画参与者的完全且准确标注的关节位置。此外,可以模拟不同的环境条件,以创建更广泛、更稳健的训练数据集,而无需进行标记式数据收集。作者声称,这种高度适应性的合成数据允许训练针对特定场景的3D人体姿态估计模型。无标记运动捕捉系统关于比赛分析的一个固有挑战是准确确定被衣物覆盖的关节位置,如肩部和髋部。一种解决方案是创建合成训练数据集,如Tong等人所提出的,其中参与者穿着常规运动服,以提高在这些条件下姿态估计的准确性。或者,同时捕捉3D标记式和无标记运动数据——如上文为验证比赛无标记运动捕捉设置所提出,并在衣物上剪洞以让物理标记点突出——可以利用前者来准确训练和优化后者的姿态估计算法,以适应穿衣条件。不幸的是,当前的商业系统很少披露其训练数据集的准备或标注方式,或其背后的严谨性,通常是出于专有原因。因此,最终用户只能接触到系统分析的最终输出,并根据商业准确性声明来解读结果。
关键点增强:检测的数量和类型
大型数据集(130
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号