编者按:本文来自微信公众号“将门创投”(ID:thejiangmen),作者赵德丽,曾就职于微软亚洲研究院、香港中文大学从事人工智能研究工作,曾任HTC高等算法研究组经理、乐视人工智能研发总监,现就职于小米;36氪经授权发布。
2017年国际消费类电子产品展览会(CES,International Consumer Electronics Show)落幕,亚马逊语音助手Alexa大出风头。参展的众多智能硬件设备都内嵌了Alexa语音功能,比如:
智能家居类:惠而浦家电、三星扫地机器人、GE智能灯、LG智能冰箱、联想智能音箱;
机器人类:LG家庭机器人、优必选机器人;
汽车类:福特车载信息娱乐系统、大众车载系统 ;
手机类:华为美国版Mate 9手机;
可穿戴类:Martian智能手表、Onvocal智能耳机,等等。
亚马逊副总裁Mike George则宣布:Alexa语音平台接入的语音技能已经突破7000。这无疑是一个惊人的数字。正是有了这样的成绩,亚马逊CEO贝佐斯最近在出席加州的科技会议才敢说:Alexa有望成为公司第四大支柱。
Alexa语音技能突破7000,意味着亚马逊无论是在技术的积累上、还是平台的构建上,语音的商业化应用都已经建立起绝对的领先优势,一骑绝尘。亚马逊在人工智能领域一时风头无两。
在亚马逊抢尽科技头条时,吃瓜群众不仅把目光投向科技头牌——谷歌。
——怎么会这样?
——又把事情搞砸了?
——这不是谷歌的强项吗?
为了把这件事说清楚,我们有必要先站在一个高度理一理语音到底意味着什么。
人类社会有两个最基本的事情:一是人与人之间的交流;二是人对工具的使用。当工具有信息产生和入口的作用时,就产生了人机交互的问题。微软提供了视窗的软件系统,改变了人类产生信息和获取信息的方式,从而也造就了微软这种世界顶级的科技公司。随着互联网的普及,信息内容的积累快速增长,怎么找到用户想要的内容就是使用计算机这种工具的基本需求。谷歌提供了世界级基于文本的信息整合和检索工具,把握了互联网信息检索的入口。但是个人电脑时代,人类和机器交流的方式主要是通过键盘输入文本来完成。这种情况下,一般要有显示屏。
但是在最近十年,人类获取内容和服务的信息入口发生了巨大的变化,从个人电脑转移到了以智能手机为中心。从而造就了提供硬件工具及交互系统的苹果和提供交互系统的谷歌的第二次辉煌。而电脑操作系统头牌微软,错过了这次新型计算设备的操作系统机遇。
从个人电脑到智能手机有一个最大的不同,就是人与设备的交互方式发生了根本性的变化——由借助键盘和鼠标变成在一个便携的手持独立设备上利用手指和触屏直接完成,这是人类使用人机交互工具的革命性进步。触屏手机的推动和普及功臣乔布斯,也因此成为科技界的神话。
智能手机的普及带来了新的信息录入方式的普及使用——语音。在文字没有发明以前,人类就是用语音来交流,语音本来就是人类活动的最基本最常用的交流形式。另外,在智能手机只有5寸上下的屏幕上,手指触屏输入也受到诸多限制,语音也是最自然的替代和补充。
由此,语音输入法在智能手机上得到了相对高频的使用。另外,随着微信、WhatsApp社交工具的普及,用户语音输入的使用习惯也已经得到很好的培养。也由于智能手机的普及使用,海量的语音数据收集也成为现实。与此同时,深度学习的出现也使语音算法处理大规模语音信息成为现实,语音技术已经基本可以满足消费级多场景下的产品应用。也就是说,从硬件设备、软件工具、算法技术、用户使用习惯,这一切条件已经成熟多时,只待语音交互以合适的形式全面爆发!
当然,我们今天谈的事情不是发生在智能手机上。相反,亚马逊自己做的手机FirePhone以暗淡收场。但是正是因为这些条件的出现,才有进一步精彩故事的发生。
基于终端大规模数据的收集和深度学习技术的出现使语音技术逐渐走向成熟,智能手机的普及也促启智能硬件时代的到来。而生活中许许多多的智能设备并没有屏幕,或是屏幕不支持便捷的文字输入,那么语音交互就是首选,代表性的品类就是智能家居。也有许许多多的场景不适合用手来交互,那么这些场景下语音也是自然的选择,代表性的场景比如驾驶。而在语音技术成熟的情况下,这一切利用语音都变得可行了。
也就是说,语音交互是下一次人机交互革命的爆发点,是人类在设备上输入信息的新方式,语音平台是人类获取信息的新入口。而这个新方式可适用的范围要远比文本大的多,也更贴近人类本来的自然交互方式。这样可以看得见的科技革命当然是科技巨头们的必争之地。
一个商业的成功总有个前因后果、轻重缓急,总有个内在逻辑。
绝大多数人都认为,谷歌具有足够的优势,有技术、有资源、有积累,而实际怎么会落后亚马逊这么远呢。事实真的如此吗?我们就来剖析一下亚马逊语音平台Alexa成功的核心因素。
2.1 设备与服务
亚马逊语音平台成功的一个最核心的地方就是处理对了设备和服务的关系。
当智能硬件设备便携的时候,相关的商业形态就发生了显著变化。硬件和软件的结合越来越紧密,硬件带服务的商业模式也越来越常见。对于在和硬件设备关联比较强的领域来说,软硬件是不是结合和统一,甚至可能决定生死。在人工智能领域,和新技术产品品类上,这一点可能更重要。
在践行设备和服务结合的商业理念中,恰恰亚马逊是做的最早而且最成功的之一。没错,就是Kindle。亚马逊早在2007年就发布了第一代电子书阅读工具Kindle,也就是和第一代iPhone的发布在同一年。是由亚马逊旗下的Lab126部门在2004年开始研发,后来亚马逊的智能硬件设备都出自这个部门。也就是说,亚马逊早在2007年就有设备带服务的成功商业模式探索,而且有自己完整的软件和硬件团队。
如果从当时的商业环境来考虑的话,亚马逊做硬件其实很好理解,我提供一个方便合适的阅读工具,让用户方便使用内容。因为那时候并没有平板电脑这种工具,而笔记本用来阅读又远没有Kindle方便。这种设备带服务的方式使亚马逊大获成功。
而亚马逊做语音服务首先就是研发智能硬件设备——Echo,而且早在2010年就已经立项开始了。而Echo的成功对于亚马逊语音服务Alexa的成功是决定性的。也就是说在语音方面,亚马逊在商业理念上领先于谷歌,在实际行动上硬件研发更是早了几年时间。所以,说谷歌在语音方面领先于亚马逊只是一般人由于主观印象造成的误解。
2.2 智能音箱Echo的意义
智能音箱Echo对于亚马逊的意义不仅仅是这个音箱本身,是整个语音业务成功的关键。
首先Echo的成功让人们看到基于语音交互的智能硬件时代的到来,这是Echo作为智能硬件号角手的意义,也是榜样的作用。再者,用户真实体验到了亚马逊语音技术的真实可用,不是华而不实的噱头。语音已经可以作为智能硬件的交互方式,应用于不同的实际场景。
除了基本的互联网语音服务,特别的,Echo作为家庭智能设备控制中枢确实真正发挥了作用,体现出了价值。通过Echo,人与家庭智能设备的交互可以通过语音顺利完成,而且由于Echo优秀的硬件设计和语音技术,可以远场语音和杂音场景下直接操控,简单而直接,这是目前智能手机还做不到的。也就是说,作为家庭智能硬件控制中枢,智能语音音箱Echo对一般智能手机有显著的差异化优势。这使得在智能手机普及的时代,Echo除了作为音箱功能之外在智能语音硬件方面有了市场空间,这对Echo的成功至关重要。
Echo成功之后,亚马逊开放了基于Alexa的软硬件开发工具,Alexa Skills爆发式增长,接入Alexa的智能硬件设备也快速增长。由此,Alexa作为智能硬件语音平台的雏形已经构建。这一切快速成型,源于智能音箱Echo的推出和成功。
另外,一个非常重要的方面——数据。懂算法的人都知道,在深度学习时代对于语音识别、图像识别等方向的算法精度,算法本身产生的差别已经很小,决定算法性能的关键就是数据,各专业领域的数据。消费级硬件Echo的推出,快速建立起亚马逊的数据优势和壁垒。所以CNET在CES2017上对语音产品进行统计,结论是亚马逊对于苹果和谷歌有大幅优势,也就很自然了。也就是说,从语音数据的完备上来说,亚马逊也领先于谷歌。
2.3 亚马逊的渠道作用
Echo作为一款智能硬件是怎么快速成功的呢?是不是切合了消费者的某种需求就能快速成功呢?显然不是。个人认为,亚马逊作为科技公司的影响力和本身就是全世界最大的网上零售商渠道密不可分。一个不是大众型硬刚需的新消费级硬件商品要想取得巨大成功,一定要有良好的曝光和分发渠道,亚马逊本身就有绝对的优势。
渠道对于硬件的作用在过去两年里的手机领域,表现的淋漓尽致。品牌影响力和渠道对新硬件成功的重要作用,在国内智能家居相关领域的电子消费品创业公司里已经而且正在被印证。比如,在过去两年国内智能家居类创业公司中,成功率最高的就是小米的生态链企业。
可能会有朋友质疑,如果亚马逊的渠道对Echo有推动作用,为什么亚马逊自己的手机FirePhone不能借助自己的渠道成功呢?Echo是新品类智能硬件,就像刚发布时的iPhone。即使在有竞品时,其性能和品质也远高于竞争对手。而FirePhone发布时已经是一个红海中的跟随者,而且还不是一个成熟的手机产品。FirePhone和Echo从产品的角度去审视,根本完全就不在一个层次上。也就是说,渠道是很强的助力器,根本当然还是要看产品。
2.4 亚马逊的云服务支撑
语音平台Alexa是要基于云计算和搜索技术来工作,而亚马逊在这一领域已经有十多年的积累,而且在云服务上做的时间最久也做的最好。也就是说,像Alexa这样一个平台级的语音系统,想做好要有强大的相关软硬件基础设施支撑。所以一般的公司即使有语音的技术,想做到亚马逊这个水平,也是很难。
2.5 算法技术与商业
一般人认为的谷歌明显强于亚马逊,在于人工智能整体技术算法的积累上,谷歌在这一块确实非常之强。但是在语音领域,特别是应用到产品上的语音算法,谷歌并不一定对亚马逊有优势。况且决定性能好坏的,算法本身的优势远不及数据关键。而亚马逊在数据的量,特别是专业数据的多样性上,随着Echo的推出建立起很大优势。
关键的是,对于算法技术本身,如果不是革命性的算法,对于商业是否成功并没有必然关联性,算法和商业可以说是两个层面的事情。首先要是商业决策做对了,算法才能更好发挥价值。而在语音商业的构建上,亚马逊明显要比谷歌高明。
再者,语音智能硬件Echo的成功并没有出现在单纯做语音技术的公司里,足以说明算法技术本身和商业的成功是两个层面的事情。决定商业上成功的因素比技术本身多太多了。
当然,不能想当然的认为技术好坏和商业成功就没有关系。Echo在语音方面的优秀硬件设计和出众的软件算法也是Echo得到消费者认可的重要因素,因为它们直接决定消费者的体验,这当然也是关键因素。其实这部分的功能设计也是由商业规划决定的,如果决定把Echo做成一个语音入口,特别是在家庭场景下不用手持就可以在近场和远场两种情况下直接语音操控,多麦克风阵列设计、波束成型技术、和软件算法的识别及去噪功能就要做的出众,这就是很自然的产品产生的技术需求。
Echo从项目立项到推出第一款产品,历时四年多时间打磨。这么长的项目周期中间发生了什么,外人无从知晓。但是对于现在推出类似产品的公司,谁都没有那么大的时间成本做这样这一款产品了。Google Home硬件产品用时可能只有Echo三分之一的时间。
2.6 谷歌是否已经失败
智能设备语音平台的争夺是否就能说亚马逊胜出了呢?到现在是的,而且亚马逊已经建立起巨大的优势。
很多人拿谷歌抢占手机操作系统和微软失去这次机遇的情况做类比,我认为这两者的商业情况并不能完全类比。谷歌对于语音商业的布局和应对亚马逊的方式,和当年微软应对手机操作系统时的方式完全不同。
而且我们也要看到,至少到目前为止,接入亚马逊智能语音平台的绝大多数都是除了手机平板电脑之外的智能设备。而全球有20亿记的设备运行着谷歌的安卓系统,特别是智能手机占有超过80%的市场份额。谷歌还有巨大的进取空间。所以将来在欧美市场上是亚马逊一家独大,还是和谷歌在不同的智能设备品类上平分秋色,现在下结论都还为时过早。
在文章开始埋下一个伏笔,就是这次CES上运行着谷歌安卓的华为美国版Mate 9手机内嵌了亚马逊的Alexa语音系统。如果说Alexa让谷歌背脊发凉的话,华为的这个选择足以让谷歌心悸了。这是安卓系统手机中第一次运行亚马逊的语音系统,而且安卓手机是谷歌在语音领域捭阖的胜负手。这对谷歌真的是一个沉重的坏消息。
亚马逊Alexa的巨大成功,是人工智能商业化的一个靓丽风景,也算是人工智能开启新工业革命大幕拉开的序幕之一。而人工智能是国内科技企业都在争相竞逐的领域,无疑模仿Alexa在所难免。所幸的是,由于语言的差异和语音技术的数据壁垒,国内科技公司在语音上有机会开辟一片天地。
自然有一个问题,是不是谁都适合去做这样的一个语音平台呢?
从技术上来说,自然想到的是科大讯飞、百度、搜狗、云之声、出门问问等企业。而且语音技术公司也都在智能家居等领域进行了广泛的布局。从和亚马逊商业模式的类比上来说,自然想到的还有阿里巴巴和京东。其实在这些企业中谁将能胜出,谁也说不准,因为决定软硬件这种平台级产品是否成功是综合因素的发力结果。最新的消息是百度和小鱼在家机器人公司深度合作,打造内嵌百度语音操作系统DuerOS的智能终端产品。
像上面分析的亚马逊成功的因素,只要沉下心来想一想,还是不难理解的,比如京东就是一个。在2015年中旬,京东就联合科大讯飞发布了智能音箱叮咚。仅仅从商业上来说,按照亚马逊的模式,京东和科大讯飞的联合确实看上去能相互采其所长,复制亚马逊Echo的成功。但事实是,即使这样的强强联合,也没有把叮咚做成像Echo一样成功的现象级产品。更别说国内这两年出现的各类各样的智能音箱了,大都是悄无声息。
这是为什么呢?
我认为最关键的就一个:中国和美国在家庭智能设备上的差异和对新工业品的使用习惯上。美国在家庭智能设备的数量及多样性上和对新工业品的使用习惯上,已经能支撑起像Echo这样的智能设备成功。
根据2016年的统计数字,美国大概有460万家庭用户已经安装了智能家居系统,而中国只有30万户使用者。美国2015年智能家居创造的市值是60亿美金,而中国只有3亿多美金。这两组数字足以说明中国和美国在智能家居基础设施上的巨大差异,而智能家居是智能音箱最重要的应用场景。也就是说,从智能音箱这类产品上来说,中国远没有美国那么成熟的条件。
但是这个局面是需要时间才能改变的。正因为如此,除了专业做语音软件技术的公司外,也给了国内做智能家居品类的科技公司一个很好的机会。
智能家居是语音应用的最重要场景之一,但是设备的智能化对于语音技术的需求是庞大而多样的,所以国内的语音技术公司有足够大的舞台结合自己的特点开拓新商业,没有必要都去模仿Echo这个产品。但是沉下心来思考一下亚马逊的成功之道还是必要的。
在此祝福国内在语音方面已经有积累的技术公司,特别是在软硬件方面都有丰富经验的公司,你们施展才华的黄金时代到来了。