对话 CTO | 听优必选科技 CTO 熊友军讲第三代人机交互中心的人形机器人时代

万事ONES
+ 关注
2021-11-04 10:28
457次阅读

「机器人将成为第三代人机交互中心,而人形机器人所具备的多模态交互是最好的人机交互模式。」优必选科技 CTO 熊友军对此深信不疑。

机器人有各种各样的形态,包括轮式的、履带式的、球形的,作为国内人工智能和人形机器人领域的独角兽公司,优必选科技一直坚持做「人形」机器人。在熊友军看来,机器人同时兼备机器和人的属性,不仅从技术实现上来讲相对容易,人形机器人的动作、表情、行为可以由人类映射,而且人形机器人能更好地适应人类社会环境,并被人类所接受。他认为,机器人最终会走进千家万户,成为人类生活的一部分。

而在人形机器人走进千家万户之前,优必选科技的发展逻辑是「两条腿走路」。一方面是坚持商业化,将核心技术输出给能为商业市场带来价值的产品,比如人工智能教育类机器人、娱乐 IP 机器人、商用服务机器人等等。另一方面是放眼未来,进行技术布局,将市场利润更多地投入到前沿技术研发当中。

瞄准服务机器人,优必选科技的重要战略

颖奇:非常感谢优必选科技 CTO 熊友军接受我们的采访。首先能否请您介绍一下优必选科技的业务情况以及技术上的先进性。

熊友军:优必选科技是一家人工智能和人形机器人公司,我们一直秉承的理念就是机器人将会进入千家万户,成为我们生活的一部分。我们最初研发机器人核心的元器件,在伺服舵机上面花了很长时间。我们认为目前机器人还是处于比较早期的阶段,伺服舵机是这个领域技术含量最高、硬件难度最大的部分。2012 年,我们正式成立了优必选科技。现在优必选科技已经形成完备的研发管理体系,我们有「12345」这样的核心战略。

「1」是指一个战略方向,即优必选科技要打造「硬件+软件+服务+内容」的机器人生态圈。

「2」是指优必选科技构建了两个机器人平台,一个是机器人操作系统平台,一个是云服务平台。

「3」是指优必选科技从三个层次布局研发体系,第一层是产品团队。优必选科技的产品分为 To C 和 To B 两大类。产品团队要面对客户、销售、市场等很多实际应用场景,这个团队是为公司创造利润的一个最主要的研发团队;第二层,在产品团队之上,我们有自己的研究院,专注核心技术研发。产品团队采用的核心技术基本都来自这个研究院;第三层,在研究院的基础上,我们还有一个团队专注于人工智能和机器人更长远的前沿技术研发。我们在清华大学、华中科技大学设立了智能服务机器人联合实验室,在悉尼成立了人工智能研究院。当上层的研究院有了技术突破,就会往下一层转移。技术一旦成熟,就会应用到产品。

「4」是指优必选科技重点关注的四个不同的领域。一是教育,优必选科技有非常强大的教育产品以及解决方案的输出能力;二是服务,家庭服务、商业服务、安防等等;三是娱乐,我们与一些品牌合作,推出了 IP 娱乐机器人;四是养老服务大健康这个领域。

「5」是指我们关注的五个核心技术领域。一是伺服舵机,包括高性能伺服驱动器;二是运动控制算法,包括机器人直立行走和运动的能力,这也是优必选科技的机器人与其他机器人的本质区别之一;三是智能服务机器人自主导航定位算法,使机器人能够及时定位和建模室内情况,做好运动规划,避开障碍等;四是面向服务机器人的计算机视觉算法,机器人需要通过视觉来感知周围环境,涉及物体识别、人脸身份识别等技术。针对这个领域,我们参加过很多国际比赛并且取得了优异成绩,也在顶级国际学术会议上发表过多篇论文。我们近期和清华大学组成火神队参加 2019 RoboCup,获得了人形组三项大奖,包括 AdultSize 的 Technical Challenge 技术挑战赛亚军、Drop-in 比赛亚军,以及 2VS2 足球比赛季军。五是机器人操作系统应用框架 ROSA。

颖奇:机器人的研发必然在硬件、软件上都遇到很多困难,优必选科技在软件方面做了哪些准备呢?

熊友军:机器人应该具有两个属性:机器的属性和人的属性。人的属性是指它应该具有人的智能,包括感知智能、认知智能和运动智能。运动方面,优必选科技已经研发了伺服舵机等核心硬件。硬件以外,还需要有运动控制算法。如果用人来类比,好的硬件就像人长得强壮健康,但一个身体强壮的人不一定拥有很好的运动能力。到目前为止,优必选科技的专利很多集中在运动控制领域。

除了运动控制以外,我们在人工智能方面也做了很多工作。针对优必选科技主要关注的家庭环境下的视觉,我们提出了 Home AI。包括机器人跟人的一些交互,比如人脸检测、情感检测、行为检测、环境检测,还有物体识别等等。机器人在家庭中成为人机交互中心后,需要知道自己在和谁交互,机器人与爸爸、孩子或爷爷的交流模式可能是不一样的,这就要对人进行识别。这个识别的技术可能和其他的人工智能公司所关注的方向有所不同,我们更多是希望机器人可以识别这个人在家庭里的身份,而不需要它从全国十几亿人口里面精准识别某个人。在交互过程中,机器人还会感知交互对象的情绪,同样的问题在交互对象处于不同情感状态下时,得到的反馈可能是不一样的。此外,机器人还需要对家庭场景下的物体做一些简单的识别,比如杯子、水、沙发等等。同时还要识别场景,比如是在客厅还是起居室等等。

人形机器人与第三代人机交互中心

颖奇:现在 IoT 及智能家居的技术已经有了一些突破,可以和人进行语音交互,并逐渐形成了生态链,对我们的生活有了很大帮助。但这其中其实经过了很长时间。距离机器人真正可以走入家庭,还有哪些技术有待突破,还需要多长时间呢?

熊友军:优必选科技专注的方向与智能家居公司是不一样的。我们希望人形机器人走入家庭后,成为下一代人机交互中心,结合目前所掌握的运动控制技术,给人提供物理上的帮助,而不仅是信息层面的沟通和交流。

技术方面还有很长的路要走。我们希望把机器人打造为第三代的人机交互中心。第一代人机交互中心是 PC,人与电脑进行交互。交互的时候,人必须坐在电脑前,利用鼠标和键盘进行交互,电脑被动接受指令。

第二代人机交互中心是智能手机,交互的时间、地点、方式相对 PC 来说灵活性更大一些,但是智能手机反馈的信息也有限。

优必选科技要打造的是第三代人机交互中心,也就是人形机器人,这是一种主动的交互模式。比如早上我来到办公室的第一件事情是安排今天的行程。机器人知道我的习惯,它会提前通知我的助理,或者主动告诉我今天的行程安排是怎样的。而且我的指令是多元化的,我不需要通过手机输入信息给它,而是可以用语音告诉它,或者通过一个动作、眼神,它就知道我的意图。

颖奇:优必选科技为什么一直坚持做「人形」机器人?

熊友军:我们一直坚持人形机器人是未来的方向,而且是走入家庭的最好形态,因为人形机器人拥有最好的人机交互模式。我们所说的机器人,实际上是机器加人,同时具有机器和人的属性。

未来机器人要在人类生活的环境中生存和发展,而这个环境对人类是更友好的。比如门把手是为人类设计的,如果机器人没有手,就不能很好地适应这个环境。所以机器人要想在这个环境里工作,最好的方式是具有人的形态,就可以操作很多人类现有的工具,更好地适应人类社会环境。

另一方面,机器人与人进行交互的时候也最好是人形。人类发展到一定程度之后,情感方面的需求会越来越强烈,交流时的认同感是很重要的。机器人如果能在外形上更接近人类,人类在情感上就会更容易接受,交互的时候更容易接纳,这是第一点。第二点,人形机器人有更丰富的信息交互方式,人也更容易理解。人形机器人表现情感,可以有面部表情,高兴的时候可以手舞足蹈。

而且一些技术我们可以由人类(动作、表情、行为)映射到人形机器人,在技术上更快迭代。机器人抓物体、直立行走等,很多都是按照我们人类的方式来做的,包括机械手臂的动作。我觉得人形机器人是唯一能够成为第三代人机交互中心的形式,现在的智能音箱只是一个过渡的产品。一旦技术突破之后,我相信大家更愿意接受人形机器人成为我们的助手和生活伙伴。

两条腿走路,技术和商业相辅相成

颖奇:人形机器人真正进入家庭生活还需要一段时间,优必选科技是否会考虑推出一些中间态的产品,在这个阶段让机器人为人类提供帮助呢?

熊友军:优必选科技选择两条腿走路,即「COO 养 CTO」战略。我们目前研发人员占比约 40%,在研发方面投入了非常多的精力,我们会把研发过程中掌握的核心技术,转化为能够在商业市场上给大众带来价值的产品。因为优必选科技是一家商业化公司,我们不是纯研究型的公司,也不是那种只关注短期利益的公司。站在 CTO 的角度,我会关注未来 5-10 年机器人产业发展的方向,公司会在技术领域做很多布局,把在市场上获得的利润更多地投入到研发中去。

商业化方面,我们会针对教育、娱乐、家庭、商用服务、安防等多个领域进行技术和产品的落地。有人认为优必选科技的部分产品比较像玩具,但我认为这是公司坚持两条腿走路的战略的体现。从商业化的角度来看,我们会思考公司目前掌握的技术,哪些是市场需要并且能给公司带来利润的,从而推动产品的落地。产品团队会获取市场需求、行业信息,结合我们对机器人的想法,去完成产品的研发。

颖奇:接下来可以简单介绍下您的个人履历。

熊友军:我博士毕业于华中科技大学,读博的时候研究的是机械手臂相关的方向。我记得有一年我们的总理访问日本,到本田的时候接待总理的是一台本田的机器人,也是 ASIMO 的前身,这个机器人带着总理参观了本田的汽车流水线。这件事当时给我带来很大的冲击,在我们做机械手臂都做得很困难的时候,日本的人形机器人已经做得非常棒了。当时我就觉得我喜欢人形机器人,以后发展方向可能就是研发人形机器人。

2011 年,我跟周总一起聊天,两人一拍即合,随后我就来到深圳了。优必选科技在 2012 年 3 月成立,开始就是做机器人的产品和机器人的系统。到了 2012 年年底,公司已经研发出 Alpha 的原型机。2016 年,优必选科技的 500 多台 Alpha 机器人亮相央视春晚。上春晚之后,在行业也引起了轰动。随后我们针对教育领域推出了 Jimu Robot,并迅速与苹果展开合作。后来陆续又跟迪士尼、Amazon 有一些合作,公司发展进入了快车道。

颖奇:能否请您推荐一些最近在看的比较不错的书给大家?

熊友军:技术方面我主要看论文,书会侧重看管理和社科方面的,比如《人类简史》。最近大家都很关注华为,我也在看有关华为的书,《以客户为中心》写的很好,还有《下一个倒下的会不会是华为》,这本书探讨了危机意识,对于认知华为也有非常大的帮助。

颖奇:有时间我也可以读一下这本书。今天有很多收获,非常感谢您的分享。

[免责声明]

原文标题: 对话 CTO | 听优必选科技 CTO 熊友军讲第三代人机交互中心的人形机器人时代

本文由作者原创发布于36氪企服点评;未经许可,禁止转载。

资深作者万事ONES
万事ONES
0
深圳复临科技有限公司
实力厂商
实力厂商
优质服务
优质服务
及时响应
及时响应
立即询价
相关话题
SaaS
相关文章
最新文章
查看更多
关注 36氪企服点评 公众号
打开微信扫一扫
为您推送企服点评最新内容
消息通知
咨询入驻
商务合作