河洛网首页 新闻 关注 房产 汽车 教育 健康 婚庆 家居 旅游

| 人工智能

娱乐 体育 财经 科技 人工智能

25分钟训练机器人学会6个动作,伯克利开发高效的机器人操纵框架

来源:河洛网    发布时间:2021-01-12     发布人:洛阳新闻网

本文经AI新媒体量子位(公众号ID:QbitAI )授权转载,转载请联系来源。

25分钟训练机器人学会6个动作,伯克利开发高效的机器人操纵框架

这个机器人手臂完成了充分、握持、移动、推、点、打开6个动作。

而且动作熟练,没有错误。

更意外的是,训练这个机器人臂只花了25分钟。

即使有人打扰,它也能成功捕捉动作。

能抓住从来没有见过的物体的形状。

这是来自加利福尼亚大学伯克利分校的新研究& mdash & mdash; 高效的机械操作框架frameworkforefficientroboticmanipulation ( FERM )是专用于机器人手臂高效操作的算法训练。

为什么FERM比其他方法更有效率? 现在很多机器人训练的RL算法效率不高。

用稀疏奖励的方法训练Dota5游戏的人机操作,达到人类玩家的高手水平,需要180年的游戏时间。

训练机器人手臂的手势需要成千万的模拟学习样本和两周的训练时间。

Sim2Real和模拟学习两种方法有点好。 Sim2Real需要接受模拟训练,并将训练结果适用于现实事例。

模拟学习需要通过一系列专业的训练演示案例和监督学习来得到最后的训练策略,实验结果很大程度上取决于输入演示案例的质量。

FERM的优点是不通过模拟训练转换为现实,不强烈依赖于输入的演示案例的质量。

基于非监视的表现学习和数据扩展技术,使用了pixel-based RL。

因此,10个Demo,25分钟的训练时间内,可以让机器人学习6个动作。

FERM具体怎么训练? FERM采用了基于像素的强化学习( pixel-based RL )方法。

具体地说,首先收集演示数据的一部分,将这些数据“ 播放缓冲器” “是的”。

然后,结合观察结果和对比损失量,对编码器进行预备训练。

然后编码器和“ 播放缓冲器” 使用一条线下的数据强化RL算法,训练RL代理。

论文总结了FERM的主要优点:

1、效率: FERM可以学习六种不同操作任务的最佳策略,在15-50分钟的训练时间内完成各任务。

2、简单统一的框架:框架结合现有的构成要素,将未被监视的预训练和在线RL和数据扩展到单一的高效框架。

3、通常的轻量设定:实施需要一个机器人、一个GPU、两个照相机、一些演示、稀疏奖励函数等。

具体的实验结果怎么样?

实验结果表明该实验用像素观察的方法执行了一系列任务。 下图的各栏显示了初始、中间、结果三种状态。 稀疏的报酬只有在机器人完成任务时才能得到。

这个训练算法可以说是高效的。 完成时间如下图表所示,30分钟左右可以让机器人学习操作任务。 简单的“ 足够” ( Reach )动作只需要3分钟。

实验结果表明,不需要很多Demo和大量设备,第一次完成任务的平均时间为11分钟,25分钟内可以训练6个机器动作。

所以研究者骄傲地说:

“ 众所周知,FERM是在不到1小时内采用来自不同群体的稀疏奖励方法的第一个机器操作任务。 ”

根据相关报告,今后10年制造业将需要460万个岗位。 很多制造商也转向了自动生产,机械自动化占了越来越高的比例。 像FERM这样的高效训练框架可以说是制造业的福音。

【编辑推荐】

如何用人工智能解决社会问题 人工智能赋予数据生命,允许过去通过各种清单和调查收集的大量数据找到重用的机会。通过数据驱动的决策,可以对症下药,利用人工智能提高社会福利。人工智能能帮助解决哪些社会问题?

人工智能能找到“伊美”吗? 人工智能能找到“伊美”吗? 整个网络都在寻找搜查令。伊美ldquo。伊美 ldquo伊美ldquo。伊美 ldquo伊美 ldquo老人清楚地告诉我,这幅画的相似度已经很高,接近90%。。 rdquo它是真实的,还没有被捕

老外大学生发明AI模型:能快速生成中国山水画的人眼无法分辨真伪最近,普林斯顿大学本科生Alice Xue的毕业论文获得了普林斯顿2020优秀毕业论文奖。 老外大学生发明AI模型:能快速生成中国山水画的人眼无法分辨真伪 毕业论文介绍了Alice Xue开发的名为SAPGAN(Sketc

比尔·盖茨:人工智能的最大影响仍然需要几十年 比尔·盖茨:人工智能的最大影响仍然需要几十年 比尔米德尔特;例如,盖茨,语音识别在20世纪60年代开始出现,但它花了50年才真正发挥其影响力。 比尔 middot盖茨相信智能机器人将很快开始从人

苹果发布新的图形处理器加速工具 苹果公司今天在加州圣何塞举行了2018年全球开发者大会。在会议上,它宣布了四大系统更新+四大基本技术更新。iOS 12、watchOS 5、tvOS 12和macOS Mojave四个主要系统都有不同程度的更新。金属、Create

免责声明:非本网注明“禁止转载”的信息,皆为程序自动获取互联网,目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责;如此页面有侵犯到您的权益,请给站长发送邮件,并提供相关证明,站长将在收到邮件24小时内删除。

热门标签

洛阳新闻网 | 新闻 | 关注 | 房产 | 汽车 | 教育 | 健康 | 婚庆 | 家居 | 旅游