智能语音交互领域,国内外群雄逐鹿。亚马逊凭借Echo走红,炙手可热,催熟了国内智能音响产业。作为背后的技术支持,智能语音交互系统 Alexa备受瞩目,也催生了中国版 Alexa学徒,数量很可能在40家以上。
智能语音交互战场,比拼的是公司在智能语音诸多技术积累、资源整合与调度、市场开拓与拓展等诸多能力。这场中国版 Alexa 大战,胜算更大的或许还是这一领域的“大公司”。
思必驰也是战场上的重要玩家之一。 成立于2007年,目前已经完成D轮融资,估值数十亿元人民币,在语音识别、语音合成、自然语言理解、智能交互决策、声纹识别、性别及年龄识别、情绪识别等智能语音技术方面都有多年积累。
这次推出的DUI开放平台 ,是思必驰自主研发、开发的人机对话解决方案,主打的特性是“高可定制化”,内置了专业语音技能库,整合了第三方内容资源,可以为物联网、移动互联网和互联网的开发者,提供单项技术服务和一站式对话交互定制解决方案。
目前市面上的智能语音交互技术平台已有不少,既有百度、腾讯、阿里这样的大公司,有科大讯飞、小米、搜狗、出门问问等智能语音交互领域的老牌公司,也有薄言豆豆、海知智能等初创公司。这个时间点,推出自己的语音开放平台,往往意味着需要找到差异点,并在技术领先性、产品易用性等方面有所见长。
差异性方面,思必驰选择了从几个方面入手: 为了方便客户实际使用,DUI 采了“ 云+端”的混合方案,除了提供云端服务,也支持本地语音唤醒、离线识别等功能; 为了满足客户个性化的需求,支持GUI 、唤醒词自定义;为了降低门槛,支持注册即可免费试用,网页操作,无需专业知识,也可以在几分钟内定制demo;为了帮助客户监控数据、优化产品及服务,打造了数据可视化平台,并可以提供用户画像。
技术参数方面,官方表示,目前DUI 在云端通用识别率超过 97 %;配合麦克风阵列远场3~5米交互超过 94 %;场景语义理解率高于 92 %;支持千万级的并发量;实时更新低于0.3 秒。
易用性很可能也是客户考虑的一个重要因素。不同于其他平台,DUI无需配置VPA( Alexa需要同时配置AWS和国际信用卡),可以将技术的要求从专业的程序员降至网页编辑。官方表示基于可视化操作,普通开发者也可以简单上手;内置了诸多技能平台,可以一键集成,且支持热更新,一个普通开发者可以在7分钟内开发出1个语音技能;而在以往团队如果自己开发,很可能需要专业团队几个月的时间。
自从Echo和Alexa兴起之后,国内各大语音交互平台的战火也逐渐点燃。有技术、有数据、有资源、有资金的BAT是战场上最要的玩家。今年6月,腾讯推出“腾讯云小微”智能语音平台;7月,百度推出智能语音平台DuerOS,阿里推出自家的智能语音平台AliGenie。A股上市公司科大讯飞此前就已推出“讯飞开放平台”,为开发者免费提供语音识别、语音合成等语音技术SDK。今年早些时候,出门问问推出基于虚拟个人助理“问问”的免费AI开放平台,提供词唤醒、语音识别、语义理解等功能。其实,这并不是思必驰第一次推出平台级产品及服务,此前,思必驰就已推出过AIOS 。
竞争激烈,厂商可能要付出更高的溢价才能抢占市场份额。目前,国内语音交互平台基本以免费为主,甚至包括内容和服务也都是免费的。这也对要做平台型的“初创公司”提出了挑战。此次,为了推广DUI平台,思必驰更进一步,采用了补贴战略,计划以补贴的形式扶持平台上优秀的开发者、优秀应用案例和创业项目。为了构建生态,思必驰还成立了2亿元的基金。短期内,很可能会吸引一部分有开发热情的开发者。今年8月,DUI项目的负责人赵恒艺在接受Xtecher 采访时曾表示,“根据平台内测阶段的用户数和活跃度来看,今年有望能突破一个亿……明年的目标是指数级增长。”
当前,不少智能语音交互领域的公司都认为,智能语音市场的规模足够大,既容得下多家巨头,又留给了诸多“初创公司”机会。此前,赵恒艺在接受雷锋网采访时称,“这个市场够大,大到充满了想象力。然而目前的一个行业现状在于,目前真正有影响力的公司应该还不超过10家,各行各业都有可能被AI所赋能。” 而在竞争激烈的环境下,不愿意早早站队的公司,很可能会选择第三方的中立服务。思必驰看重的也正是这样的机会点。
不过,要做出Alexa,并非一蹴而就。Alexa的背后是亚马逊多年的研究、研发以及这家硬件Echo的支持。随着Echo出货量的提升,Alexa的影响力也日渐提升,成功聚集起15000个skill, 并为亚马逊带来营收。而在国内,目前尚未有这样的现象级产品出现,需要平台与第三方一起探索。此外,因为国内的智能语音服务还以免费为主,短期内带来营收的可能性并不大,很可能需要探索出符合中国国情的商业模式。