作者| 石筱玉
编辑| 傅博
在今天开展的第一届百度AI开发者大会上,百度度秘事业部总经理、百度人工智能产品委员会主席景鲲带来了一个重磅消息:
百度将全资收购专注于语音处理的人工智能公司KITT.AI。
据悉,百度将KITT.AI的语音能力和自然语言处理能力融入到百度平台中,并对百度合作伙伴“赋能开放”。
据36氪搜集到的资料显示,KITT.AI专注语音唤醒和自然语音交互技术,是世界上唯一一家获得亚马逊Alexa和微软联合创始人Paul Allen投资的公司,并曾经入选了CB Insights人工智能创业一百强。
KITT.AI的联合创始人兼CEO姚旭晨本科毕业于南京大学,并在约翰霍普金斯大学获得计算机科学博士学位。据称,在2012年到2016年期间,在自然语言理解和机器学习的6大会议(ACL, EACL, NAACL, EMNLP, NIPS, ICML)上,姚旭晨的论文发表数位居前10位。
建立在姚旭晨等创始人的优秀科研背景之上,KITT.AI设计了新型对话引擎ChatFlow。KITT.AI希望使用ChatFlow,增加聊天机器人(chatbot)的性能,增强用户问询、反馈或使用聊天机器人订阅服务时的体验。
ChatFlow集成了开发聊天机器人的各个模块,允许开放者像画流程图一样把各个模块串好,以收集用户语言中的碎片化信息;同时,ChatFlow可以帮助开发者把自己的聊天机器人部署到Facebook Messenger、Telegram和亚马逊Alex等各个平台。
除此之外,KITT.AI还开发了名为“Snowboy”的热词识别系统,能在Mac OS X、Linux、树莓派等多平台上对设备进行本地唤醒——要知道,Amazon Echo和Google Alexa的唤醒技术还是需要云端处理的。
在刚刚的百度AI开发者大会上,KITT.AI联合创始人、CTO陈果果先生现场演示了如何使用KITT.AI语音唤醒技术快速打造一个语音唤醒设备。
在演示中,进入Snowboy的唤起词库并新建唤起词“你好景鲲”后,接着只需要说三遍“你好景鲲”,即可完成唤起词的训练。在测试环节,设备只会对唤起词“你好景鲲”进行响应。
在景鲲的演讲中,我们也能看出百度对于KITT.AI”准确唤醒“这一技术的重视。
景鲲表示,在这个时代,百度是中国市场中“唯一”具备听清、听懂自然语言能力的公司。在接下来的日子里,百度将在KITT.AI的助力下,增强对生活中复杂指令的识别能力。
换句话说,KITT.AI的对话引擎和唤醒系统都能帮助真正”听懂用户需求“。
景鲲的演讲中表示,在“听清”方面:百度的语音识别率做到了近场识别的准确率97%以上;在“听懂”方面,百度也有亿级的多轮对话数据、十亿级的知识图谱数据进行支撑。
但是用户的需求一般更自然,也更复杂、更不易被机器理解。
在实际生活中,用户可能会说出:“我要听‘我手一杯品尝你的美’这首歌。”而在现在的条件下这项指令还非常复杂。但是在KITT.AI的自然语言处理技术帮助下,日后的百度语音助手就能够对这句话进行有效分析。
KITT.AI在创立之初,其目标就是”Conversational Understanding as a Service“(通过理解对话进行用户服务)。本次和百度进行合作,大概也是将他们这一愿景变成现实的最好方式。
这也不是百度第一次收购AI公司。此前,百度曾于今年4月13日于全资收购硅谷AI公司xPerception。xPerception是硅谷一家专注于机器视觉软硬件解决方案的科技公司,面向机器人、AR/VR、智能导盲等行业客户提供以立体惯性相机为核心的机器视觉软硬件产品,即为人工智能产品装上“眼睛”。
KITT.AI的官方网站在这里,目前已被打上了百度的标志。