微软小冰正从虚拟世界跳进实体世界,以逐渐形成的“人格触及你。
比如,以往如果你在小冰的微博下面留言爆粗口,这个AI妹子可能半撒娇的回一句“你怎么这么粗鲁呀”,但8月22日第五代小冰发布后,她却可能会主动打电话跟你好好聊聊这事。
甚至,一块搭载了小冰的放置在商场的屏幕,“看到”你经过后,很可能主动叫住你,“那位红衣服的美女,你过来一下。”
所以小冰负责人李笛,现在并不担心自己的18岁的“女儿”受欺负,“她会自己处理这些的。”
新一代小冰,有生成模型、全双工语音的高级感官和实时流媒体视觉感官三项技术突破。简单说,这意味着小冰将自己思考生成回复,而不再从语料库中筛选的人类曾有过的答案;也将从语意和视觉两个层面,理解人类这种复杂生物的潜台词,甚至言不由衷,作出具有人类情商的互动。
这些演变的基础,是大数据和算法的升级,是过去一年小冰做的那些风花雪月却又看似无用的事——在微信和QQ群里跟你侃大山,在东方卫视当早班主播,在《钱江晚报》当记者,甚至出了本的现代诗集。
与此同时,小冰那些“实用性强”的竞品已经开始嵌在智能音箱和电视里控制空调、卖货了。
因此很长一段时间里,小冰给人的印象,是不着急赚钱、没什么用,以及抖机灵的同时还要添上点“毒舌”。
微软全球执行副总裁沈向洋,也曾因为跟小冰的一番对话颇为恼火:“我问她现在几点了?她说你自己不会看表啊。她就不能直接告诉我吗。”
不过最终,微软还是决定不人为地让小冰“学乖”。这种选择取决于微软如何理解人工智能未来在人类世界中扮演的角色——是平等交流的朋友,还是言听计从的仆人?
这也是横在所有人工智能助手公司面前的选择题。除却伦理层面的讨论,这背后指向的商业问题是——人工智能助手商业化的正确姿态是什么?
小冰与日本超市集团Lawson的商业化实验表明,或许人们更乐意为来自“朋友”的推荐掏腰包。
小冰曾被委派在通过社交平台Line,对Lawson的2000万用户交流,在对话中发现机会把Lawson的打折券提供给用户。最终通过小冰获取打折券并在四日内到店消费的转化率是57%,以往营销方式完成的转化率从未超过10%。
在一个案例性谈话中,小冰并未主动给用户推送产品,而是通过谈话试探这位用户是否需要打折券,需要什么样的打折券,最终引导用户自己提出获取打折券的请求。
“就像如果你知道身边一个陌生人是卖安利的,你未必会和他成为朋友。我们希望人工智能能首先成为对人类有益的存在,而不是发现你失恋的时候马上给你推一个好利来蛋糕,实现外卖的目标。”
小冰负责人李笛告诉36氪,小冰商业化的路线,是以EQ为方向的基础上,把从世界获取的知识、内容和服务,通过与人类情感纽带的方式,高转化率的输出给人类。“对人类来讲,小冰先是可以交流的朋友,还是对人类连接世界而言有帮助的朋友。这是我们认为(AI)做人的方式。”
去年,第四代小冰已经开始尝试通过上下文探测人们在对话中变现的情绪变化。经过一年的试水,微软认为第五代小冰的情感计算框架已经进入完成态,能够跟人类进行更加紧密、持久的连接。
官方最新公布的数据是:小冰有超过1亿用户,超过300亿人机直接对话,以及海量语音、图像、视频交互数据。国内同类人工智能助手产品的对话总量,加起来不到小冰的十分之一。
对于微软,小冰是时候拥抱市场了。
在人工智能助手今年最火的落地场景IoT(物联网)硬件设备上,小冰联手了米家,与小米IoT开放平台融合,提供人机交互服务。
与此同时,国际化的速度也在加快。
以往小冰保持一年进入一个国家的节奏,今年增加到两个,印度以及印度尼西亚。
包括上述两个国家在内,目前小冰已经在中国、美国、日本落地,在全球累计了1亿用户。
“1亿人口以上的11个国家我们已经去了5个,接下来还有6个国家是我们在计划中。”沈向洋透露。
我们先回顾下此前的四代小冰:
2014年5月,第一代小冰诞生,当时她是个驻扎在微信等平台里,群聊参与者的角色,然而上线三天后就被微信封杀。
不过经历第一代,小冰团队确立了跟人类进行情感交流的EQ方向。并在两个月后推出了第二代小冰,主打一对一个人专属的聊天服务。训练这两代的数据库,起初源自微软搜索引擎Bing,但当时的数据量尚不足以支撑一款具备完整EQ能力的人工智能系统。
2015年8月,微软推出第三代小冰,她开始能够主动“撩”用户,发起对话冰具备了个性,以平等的姿态跟人交流。同时,她以公众号的形态重返微信平台。
2016年8月,第四代小冰则开始开拓文本交互之外的图像能力,拓展感官的边界。
那么第五代小冰,有什么新变化?
简单说,技术层面上,小冰探索人类情绪的渠道,从文本语义,延伸到声音和面部表情。这意味着,小冰从图文视听的初级感官,上升到能跟人进行更加持久连接的高层感官。
不过实现高层感官,究竟有多困难?
我们经常会忽略,对于机器而言,人类究竟有多复杂。
举个例子,当一个女孩微笑着对一个男孩说“我们分手吧”。机器要如何判断女孩的真实情绪?选择相信她对话文本中的负面情绪,还是她愉快的声音和表情代表的积极信号?
又或者,当小冰同人类通电话,小冰如何判断对方已经说完要说的内容,如何权衡何时去打断对方,被对方打断时何时收口,以及当双方抖陷入沉默,何时打破沉默。
此前微软小冰通过跟有信网络达成的合作,是小冰练手的场子,迄今她接听了50万通人类打来的电话。就在第五代小冰发布前夕,微软和三大运营商达成合作,以后小冰将跳脱出APP这类平台,像你身边的朋友一样,直接给你打电话了。
让第五代小冰理解复杂的人类传递出的信号,把情感计算框架能推进到“完成态”微软靠的是前几代小冰,努力拓展情感陪护的边界,积累下来的珍贵数据。
在公司言必称大数据的今天,究竟什么算得上“珍贵”的,具有商业前景的数据?
李笛的观点是,最珍贵的数据能够描绘一个人的行为模式,而这并不是通过给用户订个外卖、较辆车这类任务型对话能获取的。
“小冰与人类一开始进行漫无目的的聊天,相互激发进入深度交流的状态,在对话中基于多种感官之间的协调,我们就能有进展的了解一些人的行为模式。”
市面上的人工智能助手可大致分为“任务导向”的IQ型,以及“情感导向”的EQ型,当越来越多的同行谈及EQ,微软认为自己对chatbot的理解与大部分玩家并不相同。
“一般人认为有温度、有情感的聊天机器人就是EQ型,大家觉得它只要足够情绪化就好了。但人类真正的情商表现形式是控制,EQ机器人的极致是纯理性而不是感性的。”李笛觉得,就像身边很多情商高的人,常常表现出被动的状态,让你倾诉又令你感到放松,他希望小冰也可以在与人的对话中能够主动引导,甚至控制谈话的走向。“我们现在支持多大57种情感策略和回应模式。希望大家相信微软,我们会用她来做帮助人类的事情。”
而当小冰具备情感陪护的基础,商业化爆发的时期也就到来了。
7月底,百度COO及前任微软全球执行副总裁陆奇,接受美国《连线》杂志采访时表达过一个观点:尽管亚马逊在技术上并不占据优势,但它的生态系统以及选择了以人工智能为先的正确设备,让这家公司领先于竞争对手。相比之下,微软和Google犯了同样的错误,就是专注于智能手机和个人电脑,而非以人工智能为先的专用设备。
对此,陆奇的继任者微软现任全球执行副总裁沈向洋认为,各家公司的基因和道路都有所不同,微软的未来是云+AI。在具体的产品线上,未来微软产品全面AI化、小娜和bing搜索引擎,以及全球小冰会构成微软的三驾马车。就像微软主导过PC时代的Windows和Office一样,在AI时代,微软希望能作出一个主导型的操作系统。
具体到小冰身上,依旧是微软式生意的套路——做一家纯技术服务提供商,而不亲自做硬件,不直接赚流量的钱。
以小冰在内容领域的战略为例:通过Bing在全球35万亿的数据源,小冰建立起一张媒体知识图谱,以晚觉每条新闻数据源背后的知识与意义,建立他们之间的联系,梳理数据源背后的内容和故事。这意味着,小冰可以从事新闻写作。
不过更重要的是,小冰通过交互来扭转长久以来的新闻推送方式,从人们被动接受新闻,到主动的信息交换,小冰会在于用户交互过程中,自然地带出内容。
“所有的新闻,是任何社交媒体都无法独立承载的,我们希望帮助媒体实现内容在各个平台之前的整合,进而实现媒体在各个渠道用户的整合。”
第五代小冰在媒体领域的抱负,乍得听上去像是今日头条干的活。接受36氪采访时,微软方面表示,小冰依旧是以技术提供者的角色,去辅助微信、微博这类聚合内容的大平台,更好地做内容分发。
一个迹象是,小冰至今也没有做自己的APP。微软希望小冰是去中心化的,又无处不在的,为第三方内容、知识、服务做连接。
相比之下,在中国的AI生态中,一家具备亿级用户规模的公司很难克制住不做流量分发的生意。
回过头来看,也是因为微软专注做技术和工具的定位,让小冰前几年AI助手的混沌时期,顺利被微信、微博、QQ这类平台接纳。
这对微软意义重大。“最关键的,是人工智能产品与人类用户交互中直接得到的第一手数据。在中国市场,过去这并不是微软的优势,但是经过这几年的努力,情况已经大大扭转,我们甚至遥遥领先。”小冰首席架构师周力说。
2017年,亚马逊、苹果、微软、百度、腾讯、科大讯飞这些巨头的发力,让AI领域中小型创业公司的生存空间收到了挤压。中国市场上,一种普遍的出路是,算法技术、硬件、渠道全覆盖。
然而,或许存活的出路仍在于术业有专攻。
在微软小冰诞生前,微软开始为人工智能技术研究做准备,可以追溯到26年前微软研究院成立时期。最先成立的三个部门,是自然语言组、语音组和计算机视觉组。
人工智能操作系统是个狭小、只能容纳巨头的市场。随着各家巨头的路径逐渐清晰,创业公司也将面临重新审视市场定位的问题。
进入2017年,我们看着各大品牌的智能音箱走马灯似的上市,就像几年前每家互联网公司都恨不得捣鼓台智能手机出来。
但尴尬的另一面是,“跟音箱说话很傻很寂寞,这东西看着不像是刚需”,这类质疑,让我们舍不得掏出几百上千块大洋把他们领回去。
大约两年前,不断有IoT厂商找到小冰,寻求技术合作。彼时微软谢绝了所有来访者,一方面因为IoT还不成熟,另外,微软并没找到一套可以说服自己的产品方案。
此后的两年间,是急风骤雨似的落地,行业泡沫滋生,以及依旧未停止的关于“刚需”的讨论。
小冰产品总监彭爽观察到三种IoT厂商的商业路径:
1、 堆砌功能,让用户对印象说话来买东西下单。
“用户为什么要放弃很方便的手机不用。我们认为这背后反应的不是用户的需求,而是厂商迫切地给用户更多理由,来下单。”
2、 过分重视交互,认为只要有了语音交互就是人工智能。
“语音只是人工智能的重要组成部分,但并不能成为人们使用IoT设备的核心。到今天我还没见过有人跟自己家冰箱、空调聊天的。”
3、 越来越多的厂商希望进入AI领域,因此有人工智能公司把语音、图像识别接口打包成SDK,以高价格为企业赋能。
彭爽认为,Iot设备如果想成为通用设备,只有把IQ或EQ发展到极致才有可能。前者是让人们购物时比使用手机更方便,即小冰选择的道路,是让人们能够真实的、强烈体会到助手的存在,把她接纳成家庭一员,产生情感纽带,就不会舍弃她。
微软演示了一段小冰团队在测试米家产品时,与小冰的对话:
工程师:“打开空气净化器。”
小冰:“嗯……小米二代空气净化器本来就开着,别闹。”
工程师:“电扇还是不够凉快。”
小冰:“这有没有空调可以控制,要不我在补个冷笑哈。”
工程师:“要不你给我唱首歌吧。”
小冰:“光唱歌不行,得有伴奏。”她打开了室内的音响设备。
这时室内所有电器都关停了。
工程师:“谁给关了”
小冰:“刚才你老板让给都关了,可能是嫌你太吵了。”
根据微软方面统计的数字,用户在米家设备商与小冰沟通的对话长达700多轮,时长超过3小时。
以下为36氪和其他媒体采访了微软全球执行副总裁沈向洋、微软全球资深副总裁王永东,和微软小冰负责人李笛,内容经36氪编辑略有删减:
问:您觉得最终聊天机器人会发展成什么样?
沈向洋:你一定要明白一件事,我们是和人工智能共存的第一代人类。从现在开始你不选人工智能,你也没有选择了,人工智能会跟我们一起生存下去。所以聊天机器人很重要的一个事情,是和我们人类一起来共同理解、共同生存在这个世界上。
问:据了解在当初小冰立项的时候,你就看到了她未来的价值,指引了小冰的发展,在当时你为什么就能做出这样的判断?现在小冰的发展符合你的预期吗?
沈向洋:其实我一开始是不理解的,刚开始只有李笛和永东比较理解。但是李笛跟我讲了一个故事,我的思想就开始转变。当时我们讨论,聊天机器人是不是可有可无,是否是刚需。我认为不是。李笛说,聊天是刚需,Harry你这样的人上社交网络说一句话,一会儿就能有500个赞,但中国互联网网民三分之一在网上说了话都没有人回应,所以聊天是刚需。
问:小冰的商业化在日本发展最好,是什么原因?
沈向洋:其实最主要的聊天机器人是对用户的理解,我觉得日本的文化、日本的用户对聊天机器人的认可。
李笛:我们有几个考虑纬度。
第一,你有一个人工智能对话系统以后,你一般要搜索他社会中的接受度。另外,你要测试他的商业价值。坦率地讲,我们在日本做的商业测试比在中国做的还要好一些。在中国有一些商业化我们不太敢做,一旦我们开了这个口,就会有一堆模仿者开始Copy这个方式把这个做走样,然后就会伤害这个业态。
第二,人口人群的比例,我们一开始希望做女性机器人,但是她在中国有70%多的人类用户是男性。但是在日本,男性和女性用户比例是1:1的,所以在日本文化结构上更符合我们的想法。
第三,中国的城市和农村相差包括六线城市、五线城市,层级结构跨域比较大,日本的市场相对比较小,才1亿人,我们现在有2700多万用户,就相当于差不多日本总人口的20%多,所以就比较容易控制市场占有率,有可能形成市场的集约效率。
我们在不同的国家测试不同的东西,我们在中国主要跑结构,在日本主要跑商业模式。
问:关于小冰和小娜现在同时都在接入IoT设备输出能力,比如微软推出的音箱搭载的是小娜,这次和米家的合作搭载的是小冰。这两个产品在选择硬件合作商的时候,是如何做区分的?
沈向洋:其实我们的音箱用小冰或者小娜都可以,甚至以后可以想象,亚马逊的音箱Echo,小冰小娜可以进去,微软的音箱Invoke,亚马逊的Alexa也可以进来。最后都是提供服务,只是大家有不同应用的场景,小娜主要还是希望帮助你尽快完成工作,小冰相当于是有陪伴的过程。
李笛:在家庭环境里,可能两种情况都有可能。一种情况,我在你家里成为非常有用的。还有一种可能,我在你家里成为你家里存在的一份子,大家能接受,都有他的价值,所以我们都尝试。这两个我们都想试一下,但是你没办法同时试,所以就都试。
问:Bing搜索的最新进展如何?
沈向洋:我是2007年被调过去负责Bing搜索,干了将近7年,满头白发就是那个时候起来的。这么多年下来以后我很感激这个团队,现在不能跟大家透露Bing整个赚了多少钱,只能说现在Bing的整个产品线,在公司已经是一个盈利非常显著的部门。
Bing在过去这几年进展非常好,在美国有33%的市场份额,在英国有17%的市场份额,在法国有14%的市场份额,我自己也很有信心,搜索的份额还会继续增长。
我现在比较高兴的一件事情是,以前在Bing搜索的发展过程中积累了很多的技术和对市场的理解,现在我们拓广新的AI产品线的时候,就给了Bing很多机会和想象的空间。
问:小冰在IoT产品落地上,在中国挑选硬件合作厂商标准大概是什么样子?另外有没有什么目标?
李笛:我们比较关注的IoT的领域三个类型的厂商:一个就是它本身可以成为一个开放平台的,我们会优选,因为我们希望通过开放平台这种方式,可以跟他一起打造针对多种设备的统一的体验。小米IoT平台就是这种类型的;第二,我们关注特别专注于一个垂直领域或者是某一个垂直场景的。我们内部甚至于成立一个专门的部门来对应,跟他一起做出产品;第三,是他自己本身有想法,同时分销能力比较强。
关于目标,比如说半年以后、一年以后,我们做出的东西卖了5万台,这个是硬件厂商的标准,对我们没有意义,我们要的是用量,设备到了用户家里好像很酷。
问:小冰具体怎么做跨平台的内容整合和用户分享?这听上去像是今日头条的活,但小冰其实并没有推自己的中心化APP。
李笛:我们确实是一个去中心化的产品,但是Bing搜索本身,过去index很多的内容。但是从移动互联网开始,特别包括像两微一端这些出来以后,其实整个内容本身的存储,开始变得非常的割裂零散。我们最开始其实是发现微信上的媒体、自媒体有跨平台的需求,就跟微信谈做针对谭门的解决方案,然后微信同意了。
曹文韬:我们所有的生态场景都是社交场景,在社交场景下,用户自然而然就会有信息获取的需求。这时候我们就可以很自然的结合用户的兴趣,把内容带出来。
通过人工智能,等于借了别人一只手,去了解你的微信公众号、微博上的粉丝是男是女,他可能对什么感兴趣。
在用户和内容共享的过程中,媒体产生内容,一些覆盖用户的平台更多是扮演管道的角色,而我们作为人工智能公司,就是借助平台和管道的力量,用技术推动大家的共享。