自动驾驶系统需要了解行人的常见手势和肢体语言,才能够处理一些突发事件,对行人做出合理反应,提高自动驾驶安全性和效率。
近日,蘑菇车联提出BalanceHRNet人体姿态估计模型,可以理解为对“人体”姿态的关键点,比如头、左手、右脚等进行位置估计,能够帮助自动驾驶精准识别行人意图。这一研究成果被国际顶级期刊Neural Networks收录。
【BalanceHRNet模型的识别效果】
Neural Networks是世界三大神经网络领域权威学术期刊之一,也是SCI一区期刊,涉及行为学、脑建模、学习算法、数学和计算分析,以及使用神经网络概念和技术的工程和技术应用。目前,人体姿态估计的主流方法是使用神经网络来识别人体关键点。近年来,该领域研究人员提出多种深度学习模型来提高人体姿态估计的准确性,包括主流的HigherHRNe模型。尽管这一模型已经取得很大进步,但在复杂环境或者拥挤场景下,不同个体间的相互遮挡会导致检测难度激增,识别准确性会大大降低。鉴于此,蘑菇车联提出BalanceHRNet模型,该模型借鉴HigherHRNet的多分支结构和融合方法,克服HigherHRNet无法获取大感受野的缺点,在更小计算量的情况下提高准确性。
【蘑菇车联研究成果被国际顶级期刊Neural Networks收录】
BalanceHRNet具有三大优势:具备更大感受野,可以提取更丰富的语义信息,并且具有较高准确性;提出平衡高分辨率模块BHRM,可以获取物体多尺度特征;学习不同分支的重要性,让模型自己决定不同分支的意义。
【BalanceHRNet模型总体结构】
测试结果表明,BalanceHRNet能够有效提升人体姿态估计准确性。研究人员将CrowdPose数据集用作测试数据集,并以HigherHRNet、AlphaPose、OpenPose等模型为比较模型。数据显示,BalanceHRNet测得平均正确率为63.0%,比最佳模型HigherHRNet提高3.1%,准确率为目前业界最高水平。每一帧画面的感知准确率都提升3.1%,数字看着小,但对自动驾驶安全性的整体提升影响很大。研究人员还通过COCO(2017)关键点检测数据集展示BalanceHRNet网络的有效性,BalanceHRNet模型比平均正确率提高1.6%。
目前,BalanceHRNet已被蘑菇车联用于高精地图,提高了感知成功率和地图精度。作为行业领先的自动驾驶全栈技术与运营服务提供商,蘑菇车联持续推动数字交通、自动驾驶领域的技术突破。
近半年来,蘑菇车联CAMO-MOT算法、IPS300+路侧多模态目标检测数据集、multi-to-single知识蒸馏框架、InterFusion融合感知、BalanceHRNet模型等研究成果陆续被国际顶级学术机构收录,这意味着相关技术达到世界领先水平。持续的高精尖技术研发和产品创新带动蘑菇车联自动驾驶车端、路端、云端系统的高速迭代,有效推动数字交通、自动驾驶大规模落地。