乍看之下有些令人意外。阿里AI lab春季新品的重头戏是49.9元的Xholder,一个通体黑色、外形类似于卡通猫的架子。把它固定在天猫精灵智能音箱上可以放一台智能手机,借助手机摄像头和屏幕来搭载视觉能力,跟去年发布的音箱一起使用,功能上即是语音和视觉能力的叠加。
至于你能用它做些什么?答案是浏览跟117套儿童教育读物的内容相匹配的图片视频,教小朋友读图识字,通过扫描4万种家庭常见药品的包装了解药物用法、保质期等等能用视觉展示的功能……你应该看出来了,它几乎是为儿童和老人而生的。
36氪记者在展厅试用了目前已开发出来的两项能力:
1、识别4万种家庭常用药品
天猫精灵接入了阿里健康的药品数据库。我拿了盒感冒药放在摄像头前,天猫精灵识别出了药品名称,用法。当摄像头对准药品上的条形码,机器播报出了保质期。
2、为儿童讲故事、教儿童识字
Xholder附带了一套儿童教育体验卡。将卡片放置在摄像头前扫描,识别成功厚屏幕就会出现一段动画故事,配合语音播放出啦。我看了一套1分钟时常的庄周梦蝶的短频,制作精良。释空说,这套短频制作的成本是5万,未来他希望整个价格能降到三位数,这样就可以大规模普及了。
阿里AI lab的产品负责人释空对Xholder的形容很实在:“这就是个长了脑子的塑料支架”。
所以,你也可以把Xholder理解成个“幌子”,它背后售卖的“脑子”其实是升级到2.0版本后新增加了视觉能力的人机交互系统AliGenie。开箱后的Xholder附带着一个二维码,扫码后就可以升级系统,通过天猫精灵手机APP里的“精灵火眼”调动视觉交互能力。
当然即便你不买支架,天猫精灵X1的系统也可以升级。释空说,二维码是种仪式感。
之所以说Xholder令人感到意外,是因为即便跟竞品同样选择了放出视觉功能,但阿里并没有用一款带屏幕的硬件去承载。
此前,几乎所有人都猜测天猫精灵春季发布的新品,应该是一款带屏幕的智能音箱,一个叠加了视觉能力的新硬件产品。正如3月26日,继此前的渡鸦raven H和小鱼在家两款音箱之后,百度发布了智能视频音箱“小度在家”。更早些时候,京东和科大讯飞合作推出了带屏幕的叮咚2代……
2018年,大厂都到了发布第二代音箱产品的时候。今年大家都在思考下一代“智能音箱”该长什么样,市场对它的定位是下一个爆款,AI硬件的标杆。
而自从亚马逊推出了带屏幕的音箱Echo show,这个问题看上去就没什么悬念了,几乎所有AI公司都在跟进带屏幕的设计。可以说,带屏幕的音箱成了种“政治正确”的设计方案了。有屏并不令人惊喜,无屏倒可能令人稍感意外。
至于如何理解阿里做Xholder的逻辑?
这种方案在阿里看来是“取巧”,借助手机屏幕让天猫精灵摇身一变成了“带屏幕”的多模态交互硬件,“零成本”升级。
当然一个无法回避的问题是,让音箱借助手机的屏幕是否体验足够好,以及这些场景是否足够刚需。对于一般的青年和成年人而言,8成的手机电量耗费在微信和通话这类通讯功能上,很难让人为了剩下两成的娱乐和其他场景,把手机拴在音箱上。
所以目前看来,Xholder更靠谱的用户群是前文所述的老人和孩子。这两个群体的粘性已经被支持远程通讯的智能视频相框验证过了。Xholder的需求能否成立,接下来取决于是否有足够的内容和服务提供给用户,增加他们的使用时长。
说回来,阿里做Xholder并不是希望把它推成像智能音箱一样的爆款标杆(天猫精灵发售至今的销量是万台),甚至靠出售硬件赚钱,而是希望用它像AI生态里的硬件厂商和内容商展示自己的系统已经具备了视觉能力。某种程度上,它是个“demo”,用于展示阿里真正的野心所在——人机交互系统。
“屏幕不等于视觉能力,不是加块屏就好了,我们不拘泥于上面那块屏是什么,我们拘泥的是有没有新的交互方式,是用视觉跟你做互动的,这才是是下一代人和机器交互的东西。”在阿里AI lab负责人浅雪看来,阿里的路子跟小米这类硬件厂商是截然不同的。阿里未来在AI上的变现模式,是卖系统,卖生态服务。
Xholder目前具备的视觉交互能力和内容资源还比较初级,阿里认为,这些基础还不足以支撑推出一款带屏幕的硬件产品。
“小孩子一天读书30分钟,识字可能5分钟,讲一个故事可能2分钟,你真的会花3000块钱买一块带屏幕的音响放在那儿作为常态使用吗?目前我们没有拿出足够多的应用支撑出来3000块屏幕带来的议价,如果有一天我们整个应用达到了我们会推出这个东西。”释空说,之后会不会推出有屏幕的产品,甚至有手有脚的产品,取决于能否带来足够的溢价和足够的用户场景。在这之前,先憋着。
或许在去年,看上去阿里、百度、小米这些公司在AI上的战略相似度很高,大家都是先做标杆性硬件。但今年,系统平台和硬件制造两种不同定位公司的路线分化会趋于明显,究竟把更多经理花在做更多硬件上,还是吸纳合作厂商上,未来会更加不同。
“我们在做天猫精灵之前,尝试跟行业的合作伙伴共同研发硬件,但在这个过程中碰到了非常多的挑战。比如跨界合作,相互并不清楚里面的问题。第二我们自己如果没做过硬件的话,并不知道中间的难处,没有办法理解做硬件的合作伙伴。所以我们去年先自己着手打造硬件。我们今年已经开始着手做系统了,并没有一定要做一个完全不一样的硬件。我们系统出来之后,有硬件的合作伙伴可以做,他也可以应用我们这套技术。”浅雪说。
此外,一项将在未来发布的能力是“万物识别”,即让机器能够通过图像视频的方式识别、理解出摄像头前出现的一切物体。不过现阶段它还是阿里AI lab的储备能力,这解释了为什么这几个月阿里办公室的桌上常出现发霉的样品西兰花和菠萝。
事实上,直至今天,智能音箱依旧不能算是刚需性的产品。下一步它还需要更多开发者来做应用服务、Skill技能,收纳更多音频、视频的内容信息,以及更能理解人类情感和语义的技术。
一点好的现象是,为了贴近刚需,今年越来越多的厂商在努力寻找能深挖的垂直场景,而不是止步于做个泛泛的、通用却不实用产品。比如儿童教育,是目前粘性最强的分支,因为相对而言,儿童对于机器交互智能成熟度的容忍程度更高。
而在炒的最火的Iot场景下,智能音箱还需努力。作为消费者,我们都希望智能家居尽早解决不同平台、品牌之间协议割裂的问题。天猫精灵目前已经跟8家物联网平台打通。其他AI平台今年也在加快推荐打通这件事。
不过阿里、百度、小米、京东这些巨头互联网公司,依旧在划江而治。从技术上讲,这些平台协议的兼容并不难实现,但从市场角度,消费者依旧得等他们先圈地征战一番,才能迎来物联网实现真正的开放。