编者按:本文作者Alex Brokaw。
Google的研究人员正试图让机器人像人一样认识世界,这意味着机器人要进行大量的练习。研究员Sergey Levine和他的团队对14台机器人手臂进行试验,这14只手臂相互连接,研究人员使用卷积神经网络让这些机器人自主学习如何抓取小物体,如杯子、胶带座和柠檬绿的玩具海豚。
经过一年训练的手臂现在可以自己抓取并捡起小物体,但是让不同的机器学习同一样任务是很困难的。机器人的手臂的编程信息通常是用来识别物体并按照预定的程序做出反应,无法想人类一样根据周围的环境做出改变。对于发生在可预测地点的任务和机器已经学习过如何抓取的物体,这是一种好方法。但是机器人可以抓取训练之外的其他从来没有见过的物体吗?
为了探究这一点,研究人员让机器人手臂伸入随机装满物体的盒子里,让它们凭借运气随机抓取物体。在一天之后,研究人员收集机器人尝试抓取物体的数据,然后用这些数据训练神经网络,让抓取物体的结果更加理想。在80万次抓取行动之后,机器人手臂就可以自动纠正自己的行动了。很快他们就可以更加顺利地抓取物体了,甚至会采用某种策略,如推开一个物体去抓取另外一个物体,或者去抓取柔软的物体而不是坚硬的物体等。
手臂的所有这些行动没有研究人员编写系统告诉它们怎么抓取物体。使用反馈环路,它们可以将抓取物体的失败率降低到18%。这些研究人员打算将他们的研究扩展到更宽的领域中,然后在实验室之外的其他多种真实环境中进行尝试。