人工智能正在一步步走向强大。今天,麻省理工学院又公布了一项新发明,让科技更进一步。
麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究人员,发明了一种名为 DON 的“密集的视觉对象网”——让机器人能学会独立观察、理解并操作它们从未见过的物体。
研究人员们计划今年10月在瑞士的机器学习大会上展示他们的新发明。
DON试图抓起一只鞋子(图片来源:MIT CSAIL)
核心研究人员 Lucas Manuelli 说:“目前的许多科技手法都无法识别物体的准确样貌。例如,现有的算法无法操纵机器手柄来抓一个杯子。尤其是当杯子的形状和摆放复杂时,更为艰难。”
DON 不是一个控制系统。相反,它是一种自我监督的深层神经网络——一种模仿大脑神经元功能的分层算法——训练机器人用精确坐标的形式来描述物体。在训练结束后,DON 能够自主地挑选出参考框架。当一个类似的新物体出现时,DON 就可以将它们映射到一起,在三维空间中计算出物体的可视化形状。
DON的视角(图片来源:MIT CSAIL)
根据研究人员所说,不论是硬的物体(如帽子)还是软的物体(如毛绒玩具),DON 都只需要20分钟就可以完成学习。DON 可以识别各种各样的物品,包括适度变形的物品以及质感非常轻薄的物品。
此外,DON 并不会分辨物体的颜色和纹理,这使得它在使用 RGB 或深度数据上更有优势。因为只要一点轻微变形,颜色和纹理就会改变,不具备“可抓取”的特性。
“在工厂里,机器人通常需要十分复杂的部件才可以工作,”Manuelli 说,“但是像 DON 这样的系统就能省去这些复杂部件。只需拍一张照片,就能掌握和操纵物体。”
DON正在抓取一只杯子(图片来源:Tom Buehler / MIT CSAIL)
团队认为 DON 可以应用在工业环境中,例如用作仓库机器人。同时,团队希望开发一个更有能力的版本,让机器人可以对物体进行“更深入的理解”。
研究人员写道:“我们认为,DON 是一种新颖的物体表现形式,可以衍生出使许多全新的机器人操作方法。”
在这个领域,国内也有很多公司在做类似的事,例如梅卡曼德、阿丘、库柏特等等。这些公司都在瞄准工业智能化市场,为工业机器人赋予视觉与触觉双重感知能力。