首页 >热门资讯> 在线作图 > 百度DuerOS发布三款开发套件和一款硬件参考设计,表示想成为AI时代的安卓 >

百度DuerOS发布三款开发套件和一款硬件参考设计,表示想成为AI时代的安卓

转载时间:2022.09.15(原文发布时间:2017.07.05)
22
转载作者:36氪企服点评小编
阅读次数:22次

全资收购Kitt.Ai、DuerOS发布软硬件一体化解决方案、跟Anker音箱合作,除了Apollo计划重磅频频,百度度秘事业部也重重刷了一把存在感。

百度工程师用17行代码,在1分钟时间内让搭载了Alexa系统的Anker音箱,从只会讲英文变成听懂中文。

百度度秘事业部总经理景鲲正式发布了DuerOS开放平台,还从从衣兜里接连掏出三款DuerOS开发套件和一款硬件参考设计(他还想带更多芯片,但是口袋实在放不下了)。他说,开发者使用这些开发套件,只要接一个电源,接一个麦克风,就可以让身边的家电说话。

百度DuerOS发布三款开发套件和一款硬件参考设计,表示想成为AI时代的安卓

DuerOS开放平台架构图

每一次人机交互系统的更迭都在推动时代变革,国外市场的智能语音助手市场,已经进入到了白热化的竞争,中国市场潜力巨大且急剧升温,各大巨头也在争相布局。

景鲲表示,DuerOS是人工智能时代的安卓系统,DuerOS希望成为一个开放赋能的生态系统。“有什么核心的要素需要满足,才能推动时代变革?我们总结出核心三要素:听清、听懂、满足。很多厂商可以做到听清,但是做不好听懂和满足,只有把这三个都做好,才能满足。”

语音交互核心三要素:听清、听懂、满足

景鲲总结,唤醒万物的核心三要素是要做好听清、听懂、满足。听懂是人工智能时代用数据和技术解决的关键问题。

1、“听清”方面:百度的语音识别率做到了近场识别的准确率97%以上,但这些在AI时代还不够。在AI时代,技术要与场景相结合。我们希望把语音放到真正的场景里面去解决问题,研发了麦克风阵列、回声消除、语音唤醒、人像识别等技术。这些都是我们逐渐推进的世界先进技术,将被放到各种场景中实现用户听清的需求。

2、“听懂”方面:数据多、介入深是打造对话系统的必然条件,具备这两点才能做好一个真正可以对话的“听懂”系统。百度是具备数据量最大的公司。百度拥有亿级的多轮对话数据、十亿级的知识图谱数据。

3、听懂并满足“听一首某某的歌”这样的用户需求还不够,真正用户想要的是更自然、更复杂的需求,比如“我要听我手一杯品尝你的美这首歌”,比如“想听哥哥的歌”,只有把用户在真实场景中表达的复杂请求做好,才能真正做出一个真正听懂用户需求的产品。

他表示,在这个时代,只有百度在中国市场是唯一具备听清、听懂、满足的实力。在现场,景鲲还演示了百度语音系统多轮交互的能力,现场演示了一台HTC手机利用DuerOS的多轮交互过程,这种交互只有百度的技术才能驱动。通过连续发问:“找一找本地人气最火爆的家常菜”、“雍和宫附近有吗”、“第二家有什么推荐菜”、“有wifi吗”、“好停车吗”……多轮连续展开的对话。他说,‘听懂’的目标,就是要FreeStyle,让用户最自然地跟设备进行交互。

收购语音智能公司Kitt.AI,跟Anker音箱合作

现场,景鲲宣布百度将全资收购人工智能公司Kitt.AI,把KITT.AI的语音能力和自然语言处理能力融入到百度平台中,全面免费向百度的合作伙伴赋能开放。

KITT.AI专注语音唤醒和自然语音交互技术,此前获得亚马逊Alexa和微软联合创始人Paul Allen投资,并入选了CB Insights人工智能创业100强。

KITT.AI联合创始人、CTO陈果果先生现在演示了如何使用KITT.AI语音唤醒技术快速打造一个语音唤醒设备。根据陈果果先生演示,进入Snowboy的唤起词库并新建唤起词“你好景鲲”后,接着只需要说三遍“你好景鲲”,即可完成唤起词的训练。在测试环节,设备只会对唤起词“你好景鲲”进行响应。

同时,百度宣布与美国智能数码厂商Anker合作,Anker音箱在中国将搭载DuerOS。

Anker在美国的合作伙伴是Alexa,为了把原来在美国销售的设备搭载DuerOS重新销往中国,本来需要重新研发,但Anker开放了Alexa,可以将百度DuerOS的能力快速节否搭载了Alexa的Anker音箱。这是智能设备开放平台拥有的便捷性。

现场,来自度秘的百度工程师罗兴演示了“如何将百度DuerOS的能力接入搭载Alexa的Anker音箱”,罗兴通过十七行代码,用1分钟的时间,让原本只会英文的音箱马上变得能听懂中国话。

推出三款开发套件和一款硬件参考设计

百度度秘事业部总经理景鲲从衣兜里接连掏出三款DuerOS开发套件和一款硬件参考设计(他还想带更多芯片,但是口袋实在放不下了):

1、搭载树莓派,利用科胜讯技术的个人版。即刻申请就可以搭载一个个人可以对话的语音设备。
2、轻量版。把一元钱大小的芯片放在任何一个设备里面,设备就可以对话。
3、标准版。两麦、四麦、六麦、八麦的标准版都可以即可申请。
4、完整一体化的参考设计。如开放电路板设计、开放结构设计、开放麦克风阵列等等。
手机、电视、冰箱等任何设备,都可以搭载DuerOS,变成一个能“听懂”的设备。

他说,开发者使用这些开发套件,只要接一个电源,接一个麦克风,就可以让身边的家电说话。“百度通过打造AI时代的安卓——DuerOS,让每个人,无论你是大公司还是小公司,甚至普通开发者,都能够以低门槛打造属于自己的智能语音交互设备。”

以下是景鲲的演讲实录:

欢迎大家来到百度Create2017百度开发者大会,非常高兴今天有机会跟大家分享DuerOS作为百度生态平台之一,我们如何向开发者赋能,为合作伙伴服务。

在讲DuerOS唤醒万物之前想先解释一下什么是唤醒万物。每天离开家之前嘱咐妈妈电视这么多的按纽别按错了,按错了导致错误的话,你今天一天都不能看电视了,电视机上为什么有这么多的按纽,人和设备的交互为什么这么复杂,设备为什么不能听懂我的语言跟人类自由的交流,这样的需求不仅存留在老年人心中,存留在每一个人心中。每个人都幻想着过着动口不动手的生活,每天回家对电视说,电视打开调到我上次看的节目,睡觉前想放松一下,想和床头的智能音响说,能不能播放舒缓的音乐。冬天很冷,想对电灯说,电灯关灯。为什么人和设备不能自由沟通,而DuerOS的核心理念就是唤醒万物,让设备和人之间能够用自然语言进行沟通,能让设备听懂用户说话,能够让设备懂得用户的需求。

而当我们回望整个科技的发展,每一次人机交互的更迭,也将推动时代的变革。最开始通过学习鼠标和键盘学会怎么跟计算机进行交互,近而接触到了互联网,而互联网和计算机推动整个时代的变革。感谢iOS和安卓创造最大的生态,让人们现在可以更加自由地用手指和屏幕交互,跟计算机交流。

而现在智能语音对话将成为更主流的自然语言交互,因为他是我们人类的语言,从生下来就会的语言,而他产生的影响相比移动时代大的多。因为他适用于每个人、适用于每个物、适用于每个地点。

看一下国外市场,国外市场也已经进入到了白日化的竞争,科技上亚马逊、谷歌、苹果、微软都已经投入巨大的人力来推动这个时代的变革,来抓住这场人机大战的机会。我们看一下国内市场,国内市场潜力巨大,需求急剧升温,中国有4.5亿家庭,3亿辆车。中国的市场要比美国市场大的多,我们看IDC出具的2020年行业报告,智能语音在家居可穿戴市场上急剧提升。

在时代变革期需要一个底层的开放平台支撑推动整个行业的发展,所以DuerOS是人工智能时代安卓系统,我们希望成为一个开放赋能的生态,就像安卓优化人和屏幕之间的手指一样,DuerOS优化用户和设备之间用自然语言沟通,而DuerOS将支撑整个行业完成这样一个转变。

我们推出DuerOS之后,DuerOS也迅速成为最具活力的生态系统,在DuerOS阵营中大家不乏看到家居企业的龙头企业,当然也包括移动设备的佼佼者、可穿戴倍的佼佼者,除了硬件厂商还包括开发者、内容平台、最大的芯片商,还有我们的方案商。大家都加入到DuerOS平台里,来推动整个时代的变革。

为了推动这场时代的变革,我们也在总结有什么样的关键因素、什么样的核心条件来满足能推动这场时代的变革。所以我们总结了一下,唤醒万物最核心的三要素是听清、听懂、满足。

由于整个市场在急剧升温,大家了解到中国很多友商在做类似的事情,有的友商只能做好听清,但根本做不好听懂。只有解决好听懂,用户才能跟设备自然的交互。有的友商有互联网内容,但技术底子薄也做不好,只有真正把听清、听懂、满足解决才能实现,而百度唯一能够做好听清、听懂、满足的公司。

百度的语音识别率达到97%以上,百度的Deep  Speech2016年MIT十大突破性技术之一。只做好这些还不够,人工智能时代要与场景结合,放在家庭条件、家庭小房间,放在车上,把技术真正放在场景里解决问题。所以我们研发了远场相关的语音技术包括麦克风阵列、回声消除、波束成形、语音唤醒、远场识别。

所以听清我们做好了,但还不够,我们要做好听懂。听懂是AI时代用技术解决的核心问题,只有解决听懂,用户才能跟设备自由的进行沟通和交流,而数据多、技术深是打造对话系统的必要条件。百度在这个市场上具备着巨大的优势,在屏幕上的关键词,千万、亿级、十亿、百亿、千亿。百度拥有亿级的多轮对话机制,让我们知道用户跟百度对话过程中究竟表达哪些需求,究竟多轮是什么样的场景。我们具有十亿级的数据和百亿级的知识,知识将是这次AI革命非常重要的一个数据,只有知识、具备很多的知识才能真正听懂用户说的话,才能听懂用户表达的每一个关键词的意思。

除了数据之外百度在技术上一直是佼佼者,率先把机器学习应用到多个领域里来打磨我们的技术,对话、搜索、广告来打磨我们的技术。我们的自然语言处理技术一直是行业领先者,我们有十多年的技术储备,覆盖基本上所有自然语言和方向。我们的DuerOS技术率先采用深度学习和增强交互的方法,应用在场景个性化等多轮对话系统。我们的搜索技术更没有问题,世界上首家率先引入语音图象多轮交互的功能化搜索和智能化交互。

有了数据、有了技术,就要满足用户所求,当用户跟一个设备说,我想放一首歌的时候,要满足用户的所求,这些在人工智能时代还不够,因为人们在跟设备沟通的时候会表达更自然的表达法,这些是Create真正在设备之间在人机对话的数据,我要说一句歌词,这是周杰伦的一句歌词,想通过歌词来听歌曲,这是用户自然语言表达的一个需求。只有把这些自然语言都满足才能做到一个听懂的系统,不仅做到单轮,在兼容里边还会做到多轮。

接下来一段视频我们来一起看下百度如何在DuerOS系统里满足用户的需求。

(播放多轮语音交互视频)

刚才这是一款搭载了DuerOS的手机,只要用户轻轻捏着边框就可以语音助手,设备在我们展区,有兴趣一会儿可以体验一下。只有解决多样用户的表达,满足多轮场景的需求,才能真正让设备听懂用户的表达。而听懂的目标我们的设计FREESTYLE,在座有一些人可能有一些陌生有一些人比较熟悉,FREESTYLE这是最近非常流行的词语,FREESTYLE是希望用户表达不要有拘束,不要记住特定的指令,想你所想,说你所想表达的东西,这是我们的目标。

百度对技术的追求一直永无止境,除了自己的技术,我们会聚全世界最顶级的数据开放赋能,为我们的合作伙伴服务。KITT.AI,是一家顶级的人工智能创业公司,是一家西雅图创业公司,入选了CB Insights人工智能创业公司100强,他专注在设备的语音唤起和自然语音处理技术,是世界上唯一一家同时获得亚马逊、Alexa和微软联合创始人POERRY投资的公司。今天我非常高兴地向大家宣布,百度将全资收购KITT.AI,并且将他的语音能力、自然语言处理能力全面加入百度开放平台,全面免费向合作伙伴开放。所以在此我也有请KITT .AI的联合创始人陈果果上台,为大家演示一个产品SNOWBOY。

陈果果:今天我会给大家展示我们其中的一款产品,是跟唤起词相关的产品叫做Snowboy。首先在座各位可能不是特别理解什么是唤起词,其实人和设备的交互和人跟人的交互是非常类似的。举一个例子路上碰到了景鲲,想跟景鲲说话,我自然的知道了景鲲的名字,景鲲听到就停下来跟我对话,人跟设备的交互一样。我们说到唤起词的时候,设备就会意识到,我们想跟设备通话。接下来演示如何用SNOWBOY如何快速激起唤醒词。

登陆网页首先是唤起词列表,来自全国各地开发者训练的各式各样的唤起词,2012年5月份至今超过12000名开发者,将近9000个不同的唤起词,有中文、英文、俄语、法语以及其他语种的小语言。SNOWBOY这么受欢迎是两方面的原因,一个是性能上的优势,将大型的神经网络压缩到几个兆,甚至更小几百K,SNOWBOY就可以运营起来。第二个原因是简单运用。

首先点按纽新建唤起词,第一步需要输入唤起词的基本信息,刚刚用到了景鲲的例子,所以输入一个唤起词,你好景鲲,语言是中文。输入完毕可以进入第二步,第二步需要将唤起词说上三遍。到这一步的时候唤起词进入完毕,测试的时候会对唤起词本身做出反映。测试一下,你好景鲲,在此之后说其他的语言他不会做任何的反映,只会对唤起词做出反映,测试完成点击保存并且下载。

到现在为止,你好景鲲这个唤起词已经新建完成。SNOWBOY后续支持特别多的编成语言和硬件平台,开发者可以根据自己喜好选择他所想要的唤起词,选择他想要的唤起词语言,并且加入进来。SNOWBOY已经成为最大的开发唤起词社区,我们也是受到亚马逊绢纺推荐作为第三方Alexa唤起词技术提供商,KITT唯一一家受到亚马逊投资做唤起词技术的公司。

最后我感到非常荣幸KITT之可以加入到百度DuerOS大家庭,KITT已经在中国获得非常大的成功,我们非常期待和行业领先者走在一起一起将语音交互变的更加简单。

景鲲:大家已经看到了,我稍微解释一下,通过陈果果三次的训练,那个笔记本就叫景鲲了,以后看到这个笔记本的时候就可以说,你好景鲲。

百度不仅仅是KITT公司进入到百度,我们希望全世界最顶尖的技术,我们会吸纳全世界最顶尖的技术,并且加入到百度开放平台当中,向外界开放赋能。

说了听清、说了听懂,最后满足也非常关键。不能听的清又听的懂,百度是中国市场唯一具备数据范围非常广的公司,我们覆盖的内容和服务非常多。当一个设备接入DuerOS,会有十大类,一百多类的小能力为设备厂商进行开放。不止这些,还会有第三方开发平台,引入第三方内容方和开发者,为百度,为DuerOS,为设备贡献更多的内容。这是一些百度数据的冰山一角,我们有1300万的百科,360万个餐厅,6亿个商品库,2000万的歌曲。今天开始只要设备接入到DuerOS,所有的设备、所有的数据都会全面免费向设备进行开放。

所以DuerOS是真正能够做到听清、听懂、满足的开放生态系统。但是直到这些我们觉得还不够,因为在AI时段,软硬结合将是一个趋势,软件和硬件更多的会融合到一起,目前软硬结合还会有很大的障碍,开发成本还比较高,很多写软件的同事不知道怎么写硬件,写硬件的人不知道云端的软件怎么做。所以为了针对这个问题、解决这种困难,DuerOS将提供最容易上手的软硬件一体化解决方案。

软硬件一体化解决方案包括了多样化的开发套件和完全开放的参考设计。其中开放套件包括个人版,利用先进技术做的个人版开发套件,让每个开发者拿配件回家就可以组装成一个可以对话的设备。包括和RDA、Realtek合作设计轻量版的语音功能,也包括标准版我们跟业界听见公司MTK、全志、Intel、Rockchip、高通、科胜讯、声智、先声6个、8个的麦克风。还包括一体化的参考设计,电路板设计、开放结构设计、开放麦克风陈列设计,大家可以登陆DuerOS官网马上下载并且申请相关的材料。

光说不练假把式,在我的口袋里就是DuerOS的个人版的开发套件,今天大家就可以登录官网把开发套件带回家,搭建属于自己的个性化的设备。在我的口袋里还有另外一个智慧芯片,他的大小大概是1块钱人民币的大小。把DuerOS智慧芯片加上电源、麦克风、扬声器,就是一款可以对话的设备。

当然除了个人版、轻量版、标准版我们也准备了,只是我口袋里装不下。大家可以看到这就是我们跟合作伙伴一起研发的DuerOS多麦克风陈列的标准版设计,把这些多麦克风全部放在一个设备里,这是今天完全开放DuerOS参考设计,所有屏幕上的一切,大家都可以即刻登陆DuerOS官方网站下载、申请。

除了开发套件之外,我们针对我们的合作伙伴还开发场景一体化的整体解决方案,无论我们的合作伙伴是在做音响、电视、冰箱、空调,任何一个设备场景化的整体化的解决方案为你服务。

还有一类特别的合作伙伴Anker就是这样一个例子,他是涉及配件全球领导的一家企业,是在深圳的一家公司,致力于弘扬中国制造资本。他下面希望打造一款人工智能音响,让用户跟设备之间可以用语音进行对话、交流,所以他希望跟全世界的领先技术先行者一起合作打造这款音响。在美国他选择了Alexa,在中国他选择了DuerOS。要把一款销往美国的设备搭载DuerOS重新销往中国,需要重新研发。为了满足用户的需求,感谢Anker开放了Alexa,能够把一款销往美国的设备很快销售到中国。

有请百度度秘工程师罗兴给我们演示如何搭载这样的一个设备迅速接入到DuerOS。

 

罗兴:谢谢景坤,大家好,我是DuerOS的工程师罗兴,在我的前面是数模块,在前面已经接入DuerOS的设备,我现测试一下这个设备。

接下来我将现场将这个设备接入到DuerOS,大家可能不知道,一个设备要接入新的服务需要复杂的事情,我们需要开发所有的功能代码,需要至少五个人来做产品功能研发,整个调试周期长达3到6个月,但是今天这一切将变得非常简单。到底有多简单呢,我来给大家演示一下。

搞定,就是这么简单。接下来我给大家介绍我的操作,我刚才运营了一行命令,这个命令对修改程序17行代码,其中17行是让设备登录DuerOS的帐号登陆,后边一行让设备连接到Alexa的开放协议地址。现在测试一下接入到DuerOS的设备效果。你叫什么名字?小度:我叫小度,以后有事情都可以来找我。今天天气怎么样?小度:北京今天空气质量指数为114,空气质量轻度污染。上海呢?小度:上海今天空气质量指数为60,空气质量良。5点提醒我去上海。小度:请问是今天下午还是明天凌晨。今天下午。小度:为你设置了今天下午五点的闹钟,小度准时提醒你去上海。

一分钟让接入到Alexa设备接入到DuerOS。我的演示完了,刚才所有的演示文档都可以在DuerOS的开放平台上获取到,现场如果接入到设备厂商,我们今天就可以回家试试,只需要一分钟时间,就可以让你的设备进入到中国市场。

谢谢大家!

 

景鲲:原来一款打在Alexa服务的销往美国的音响,我们把他搭载DuerOS销往中国,这个过程只需要1分钟。今天合作伙伴就可以到DuerOS官网下载相关材料。

在我们的合作中还有一位特别的开发者,我们有很多的开发者用户,但这一位开发者用户尤为特别。今年4月份的时候,我们收到来自与杜志鹏的一封信,杜志鹏是一名深圳嵌入式工程师,他的小外甥特别喜欢一个玩具,跨下海口说我把你的玩具改造成可以对话的玩具,最后发现百度的DuerOS是最适合他搭建这样一个设备的服务。所以他联系到我们,在他整个信件最后一句说,你们能不能帮我实现这样的目标,我不想成为说大话的大舅。

看完这封信我们很触动,为了让杜志鹏不是成为说大话的大舅,为了让语音对话设备进入千家万户,我们把轻量版套件寄给了杜志鹏。接下来请大家看一段视频。

(播放视频)

我们非常高兴让DuerOS的能力也能支持像杜志鹏一样的普通的开发者,我们今天也特别有幸请到了杜志鹏和他的外甥本人来到了现场。有请!当然我们还要有请一个特殊的合作伙伴,来自乐高中国市场部副总裁王俐。

杜志鹏,你为什么想做这样一个语音交互的玩具?

杜志鹏:我看见小外孙这样一个机器人,我希望可以让他更可爱可以跟他聊天。

景鲲:小朋友,你喜欢跟他聊天,你最喜欢问他一个问题,问了之后笑哈哈,是什么问题?

小朋友:恐龙是怎么灭绝的?那是怎么灭绝的?

杜志鹏:恐龙自己吃的比较多,放屁产生了温室气体,他觉得在这个场合不太适合。

景鲲:你希望大舅多做一些可以对话的玩具给你吗?

小朋友:希望。

景鲲:王总,为什么希望从乐高角度支持杜志鹏完成这样一个项目。

王俐:作为乐高非常希望让玩具展现非常不一样的玩的体验、互动的体验,和百度一样,乐高品牌也是致力于拼打体验过程,将具备可视化的变成功能,未来乐高非常期待和百度这样人工智能的领跑者进行合作,给全世界的乐高消费者带来丰富的玩乐体验和充满想象力的创造空间,未来属于创造者。谢谢百度。

景鲲:谢谢!所以DuerOS不只希望赋能于行业巨头的合作伙伴,也不只是希望行业剧透的创业公司,我们希望赋能每一个有梦想的人,只要你有梦想,你想做一款语音交互的设备,我们就希望把这个设备开放给你,今天在线下还有看直播的同学,可以即刻登录DuerOS官网,下载打造一个可以对话的设备。

今天下午我们也会有更加密集的活动,向大家详细讲解DuerOS架构,其中包括小度智能设备开放平台,小度对话开放平台。小度对话开放平台如何做到能听清听懂,小度对话开放平台如何做到引入,我们有核心接入组件等软件方案,让他成为一款可以最容易上手的开放平台,今天所有的开放平台资料都可以在官网找到。

最后,我们也希望DuerOS作为百度核心人工智能开放平台之一,真正开放赋能,推动时代的变革,赋能我们的合作伙伴,赋能内容商,赋能芯片商、赋能整个生态,希望大家一起共同开创美好的明天。

谢谢大家!

36氪企服点评

在线作图相关的软件

查看更多软件

行业专家共同推荐的软件

限时免费的在线作图软件

新锐产品推荐

消息通知
咨询入驻
商务合作