河洛网首页 新闻 关注 房产 汽车 教育 健康 婚庆 家居 旅游

| 人工智能

娱乐 体育 财经 科技 人工智能

手机里的3D姿势,模型尺寸只有同类的1/7,但误差估计只有5厘米

来源:河洛网    发布时间:2021-10-12     发布人:洛阳新闻网

本文经AI新媒体量子位(公众号ID:QbitAI )授权转载。 转载请联系出处。

手机里的3D姿势,模型尺寸只有同类的1/7,但误差估计只有5厘米

长期以来,三维姿势被认为在追求准确性方面狂奔。

但在精度提高的同时,也带来了计算成本的上升。

在刚刚被CPVR 2021接受的论文中提出的模型,MobileHumanPose可以同时变小。

就像放在手机上也能保持住一样。 感受一下这个feel :

这个动作的健美操也没问题:

发现该模型的大小只有基于ResNet-50的模型的1/7,计算力达到3.92GFLOPS。

另外,每个关节的平均位置误差( MPJPE )也只有约5厘米。

那么,该模型如何以有限的计算能力发挥优异的性能呢?

编码器-解码器结构的改进这是从基本的编码器-解码器结构改进的模型。

在编码器用于全局特征提取、解码器进行姿态估计的基础结构中,研究小组修改了主干网、激活函数和Skip concatenation功能。

首先,让我们来看看研究小组选择的骨干网络,MobileNetV2。

他们用MobileNetV2的前四个倒置残差块( Residual Block )调整了通道大小,提高了性能。

接着,使用ai为学习参数yi的输入信号即PReLU函数实现激活功能。

由于该函数的可学习参数为各层网络提供了其他信息,因此在人体姿态估计任务中使用参数化PReLU可以提高性能。

△修改了激活函数的baseline

目前,模型的效率并不差,但考虑到推理速度,团队使用了Skip concatenation结构。 该结构可以从编码器向解码器导出低级特征信号,而不会使性能降低。

参数量减少了5倍,计算成本降低了1/3的团队使用Human3.6M和MuCo-3DHP作为三维人体姿态数据集,提出了MobileNetV2大小的两个模型。

在Human3.6M上,MobileNetV2大模型实现了51.44毫米平均关节的位置误差。

另外,其参数量为4.07M,比同类模型的20.4m(Chen )减少5倍,计算成本为5.49GFLOPS,不足同类模型的1/3 ) 14.1G )。

针对多人的三维姿态估计任务,研究人员利用RootNet估计了每个人的绝对坐标,在MuPoTS的20个场景中进行了实验:

实验结果表明,与Zerui Chen等人提出的获得ECCV 2020的三维人体姿态估计方法相比,MobileNetV2在一般场景下性能更好,在少数场景下获得了最佳性能

模型效率方面,MobileNetV2的较大模型效率为2.24M/3.92GFLOPS,远远超过同类模型的13.0m/10.7gflops(zeruichen )。

小型模型也可实现56.94个关节平均位置误差,有224万个参数,计算成本为3.92GFLOPS。

作者介绍论文的三位作者毕业于韩国高等技术研究院,Sangbum Choi是该校电机与电子工程专业的硕士学位。

论文: HTPS:/ /开放访问. The CVF.com /内容/ CVPR 2021 w/Mai/HTML/Choi _移动设备_真实-时间

开源地址: [1] https://github.com/Sangbumchoi/mobilehumanpose [2] https://github.com/ibaigorordo/ononse

【编辑推荐】

2021年中国人工智能行业市场现状及竞争格局分析人工智能是引领未来的战略性技术,已成为国际竞争的焦点。 我国人工智能行业主要分为基层、技术层和应用层三层,其中应用层涵盖企业技术集成与方案、智能商业与零售、智能机器人、智能硬

最快的AI电脑启动,每秒4百亿浮点运算! 连接着最大宇宙3D地图计算机探索宇宙的宏伟瞬间! 最近,被称为世界上最快的人工智能工作负载的超级计算机mdash; Perlmutte宣布开业。 这台新的超级计算机包括6144个NVIDIAA100张量的核心图形处理器,负责史上最大的可

人工智能所涉及的领域有哪些? 其原理是什么?随着现在工业技术的发展,我们的生活得到了很大的改善。 新家具层出不穷。 厨房用品、生活用品等技术更新不断重复,不仅如此,在移动,甚至娱乐领域,都发生了非常大的变化和进步。 在这

年末收藏! 呉恩达棚卸2020年度AI人気事件本文由雷锋网转载,必要时转载到雷锋网官网申请授权。 年末收藏! 呉恩达棚卸2020年度AI人気事件 昨天吴恩达圣诞节回顾了2020年AI的重大发展。 支持AI的新型冠状病毒大爆发、数据集存在种族偏

用AI实现了c:+、Java、Python代码的对译,执行成功率最高达到了80.9%。现在开始: 6月19日,网络银行设计师魏生就网络银行实施路径的探索和思考,取得PS新媒体量子位(公开号码ID:QbitAI )的许可转载,请与出处联系。 用AI实现了c:+、Java、Python代码的对译,执行成功率

上一篇:人工智能如何为未来城市提供动力?

下一篇:没有了

免责声明:非本网注明“禁止转载”的信息,皆为程序自动获取互联网,目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责;如此页面有侵犯到您的权益,请给站长发送邮件,并提供相关证明,站长将在收到邮件24小时内删除。

热门标签

洛阳新闻网 | 新闻 | 关注 | 房产 | 汽车 | 教育 | 健康 | 婚庆 | 家居 | 旅游