有着李开复等一众科技风投圈知名人士为其站台的小鱼在家,又多了一个科技领袖为它站台——百度集团的总裁兼COO陆奇。
4月28日,百度DuerOS和小鱼在家,终于正式发布了CES上展示的新品,搭载百度DuerOS的新款视频通话机器人“分身鱼”。
发布会透露,这个产品可以用手机调控屏幕转动,也加强了语音的能力。小鱼在家表示,分身鱼可以在10米内与用户自如对话,通过人脸识别用户身份,屏幕会随着用户移动转动,并根据用户的不同提供个性化的服务。小鱼在家还找来了前苹果设计总监参与这个产品的设计,36氪跟他做了专访,具体请戳《小鱼在家请来前苹果设计师为产品把关,做智能音箱的“核心要领”究竟是什么?》。
姚晨和宋晨枫
这个发布会,由本来可以出道却选择了连续创业的小鱼在家创始人宋晨枫主持,他现场和明星姚晨展示了这个机器人的一些可以通过语音完成的功能。比如,姚晨问“冬虫夏草是什么”,小鱼在家就自动播放秒懂百科;问“苹果英文怎么念”,产品就会说“Apple”,同时跳转到百度翻译“苹果”单词的界面;说“寻找折耳兔的照片”、“想听姚晨的歌”、"想看电影西游伏魔篇"等需求,也都会自动播放图片、歌曲和电影预告片;“我想买牛奶/啤酒”等消费需求,也可以自动完成下单,通过人脸识别支付。(这个购物的场景,机器自动选了牛奶的牌子,让我有点疑惑,如果不是用户想要的呢?)
根据小鱼在家主打陪伴的家庭场景,产品也有很多针对此设计的功能,包括扫描题目会出现解题过程,24小时移动录制家庭小朋友视频。
从展示的功能可以看到,百度和小鱼在家的产品也做了比较深度的整合,其中不少需求由百度生态内的产品完成,底层的自然语言处理能力,也是由百度提供。
这不是DuerOS正式落地的第一个场景,此前,百度和国安广视、海尔、美的、vivo等厂商(据说vivo上的使用不错,氪星读者可以体验一下),都相继宣布了合作,而且推出已经落地的产品;但小鱼在家却是吴恩达、陆奇、景鲲(度秘事业部总经理)和朱凯华(度秘事业部CTO)都站过台的产品。双方合作已经有一年。
百度对于小鱼在家的而言,最核心的,莫过于前者拥有的自然语言处理技术。小鱼在家投资人李开复,和宋晨枫都指出了这一点,后者也曾经在接受36氪专访时透露过,百度的自然语言处理技术,对小鱼在家的产品体验,有明显提升。
至于小鱼在家之于百度的意义,是家庭场景。
每家科技公司,似乎都在占领着用户不同的场景,占领场景的广度与深度,影响着这家公司的价值。陆奇现场的演讲中就说道,“微软是一家很了不起的公司,但是他的场景是在办公室,一旦离开办公室之后,这个(使用场景)就不存在了。”
陆奇
DuerOS在百度的人工智能布局中之所以那么重要,是因为他们相信“DuerOS会无处不在,它可以在任何一个器件上,在任何一个场景上,在任何一个环境中,跟任何一个人都有交互的能力”(陆奇语)。提供基础能力的百度,无疑是要占据尽可能多的场景。
场景意味着用户,对于现在的百度而言,更意味着现实场景中的需求和行为,这也是改进和训练DuerOS理解用户需求所需要的数据。甚至长远来看,这可能是未来商业变现所需要沉淀的数据之一。
这样的逻辑跟微信和支付宝的基础支付占领场景有点像,支付就像是后续一系列金融、交易的入口,同时能沉淀大量线下交易数据,了解用户需求和画像,以供后续营销。不过,智能语音交互平台的逻辑,可能还是更习惯用安卓系统来类比。
其中,语音交互最被看好的切入场景之一是智能家庭。自从亚马逊Echo出现之后,国内想切入这个场景的创业公司不胜枚举,只是没有几个活了下来(所以有人认为这是个伪需求)。小鱼在家是最早做而且还活了下来的,积累了一定的用户数据,有助于跟百度一起改进产品。景鲲今天接受采访时就提到了小鱼在家沉淀的数据。
家庭场景之外,DuerOS还会在汽车等更多的场景落地进行整体布局。之前宣布的阿波罗计划,就隐含着百度类似的想法。
落地了场景,不一定意味着占领了这个场景。厂商、用户、开发者,每一方都要搞定哦。
语音交互性质的机器人,最终面向的都是C端用户,只有当用户在这个场景中主动使用你的产品,才算真正占领场景。
这得靠优化产品体验,陆奇在演讲中就总结,在百度人工智能的总体布局当中,最最关键的是场景落地,把用户体验做到极致,然后迅速迭代。
DuerOS在现场整个演示非常流畅,两位用户想必经过了一定的编排(既然是资深用户,也不排除姚晨和宋晨枫已经非常了解该怎么和小鱼对话),但还是能发现这个语音交互产品的需要改进的地方。
1、语音识别在现实环境中的准确率。景鲲表示,百度的语音识别在实验室环境下可以达到97%-99%的准确率,但现实场景中会有电视等噪音的干扰,目前还没有特别准确的测量方法,但总体来说还是很有挑战,百度的实验室也在模拟现实场景做优化。
2、第三方应用交互的语音化。目前,大多数拥有技能的第三方应用,还是以触摸的交互方式为主,这就意味着DuerOS的语音交互,很多时候只能止步在打开某一个应用这里。
在一个场景中,无法做到完全的语音交互,比如,在汽车场景中,司机希望听我氪的“氪星晚报”,如果36氪跟DuerOS合作,一说“我想听36氪的氪星晚报”,系统就可以直接打开36氪播放,如果没有合作,系统只能做到打开36氪,然后司机却需要手动找到“氪星晚报”。
只有百度将某个场景中最高频的“操作”语音化,大概才能说真正拿下了这个场景,也就是说,百度需要跟大量的第三方应用合作,以完成整个操作语音化。景鲲说会谈一些合作,但目前不能透露哦。
除了适配存量APP,直接让开发者开发语音原生APP也是一个路径,百度也有在跟一些开发者对接。
3、语音交互自然化的程度。现场姚晨和宋晨枫给的指令都非常清晰,但其实自然语言交互还有一个很明显的特征,就是非结构化,目前大量应用UI的设计逻辑,都是将自己拥有的功能和服务结构化,比如大众点评将店铺按照地区和类型。用户在用语音提需求的时候,不一定会一句话说“我想在中关村附近的金逸电影城看两点半那场《嫌疑人x的献身》”,而是可能要通过几次交互来完成的,甚至还会有各种奇葩需求。景鲲之前表示,会通过打标签来完善这个体验。
还有其他影响交互流畅度的设置。目前,用户每次每和这个机器人说一句话之前,都要说:“小鱼小鱼”(如果小鱼是个人估计会被烦死),实际上自然语言对话很少如此。景鲲表示,其实这个需求百度也注意到,已经在着手解决;而且实际上人人对话,也是有“隐藏”的唤醒词,比如一个眼神,因此,拥有屏幕的小鱼在家,也拥有类似的“凝视唤醒”功能。
如今,DuerOS落地的场景不少,包括上面提到的电视、厨房、手机、家庭等,甚至是未来的汽车,语音交互性质的硬件不断涌现,每个拥有一定场景的厂商,无论是音箱、手机、家庭机器人,甚至是冰箱,都希望自己成为控制中枢。每个都有属于自己的唤醒词,用户是不是也有点纠结,不过原来,所有搭载DuerOS平台,也都会有一个副唤醒词“小度小度”。可是却从来没有公布过......
可见,这次的百度,甘愿做“在你成功背后”这样的角色,而不一定要有百度的品牌露出。在特定场景上,景鲲表示,还是会更了解合作伙伴的需求,根据痛点做定制,把能力给到合作伙伴(其实降低适配门槛也是百度在厂商这一端的策略,具体可以参考文章《百度进驻冰箱和音箱背后,是想成为AI时代安卓系统的图谋》);在用户端,则希望理解用户的需求,“让他们觉得这个东西有用,提高用户对类似产品的认可。
既然想做平台,让不同硬件厂商和消费者产生依赖,才能占领更多场景吧。趁阿里和腾讯等还没开始,百度动作要快。