语音技术正在改变计算行业

转载时间：2021.05.19（原文发布时间：2017.01.09）

190

转载作者：36氪企服点评小编

阅读次数：190次

英国科幻小说家 Arthur C. Clarke 曾经说过，任何足够高级的技术都近乎魔术。迅速崛起的语音计算技术证明了他的观点。使用该技术如同下咒语一样：只需要对着空气说几句话，附近的设备就可以满足愿望。

亚马逊Echo是一台语音圆柱形计算机，我们可以将它放在桌面上，呼叫“Alexa”就可以唤醒，它可以播放音乐，讲笑话，回答旅行问题，控制智能家电；就在圣诞之前，4%的美国家庭已经拥有Echo。

在智能手机市场，语音助手迅速发展。每周苹果Siri处理200亿个命令，在美国来自Android手机的Google语音搜索已经占了20%的份额。用语音发邮件、写信息已经相当可靠。既然能够说，为什么还要输入文字呢？

这是一次巨大的转变。语音有能力改变计算产业，它可以用更自然的方式互动。Windows、图标、菜单、触摸屏，与复杂的键盘相比它们无疑都是非常直观的交互方式。

如果可以与计算机对话，就可以完全废弃“用户界面”。手机不再只是没有线的电话，汽车不再只是没有马的车厢，同样的，没有屏幕和键盘的计算机可以变得更实用，更强大，更流行。

语音不会完全取代其它输入输出方式，有时，输入比说话更加方便。但在我们使用技术的过程中，语音的地位会越来越高。要完全发挥语音技术的潜力，还有一些障碍需要突破。

Alexa，什么是深度学习？

计算机口述系统已经存在多年了，不过系统并不可靠，需要进行长时间训练才能理解某个人的声音。近年来，计算机不需要训练就可以识别任何人的语音，这些突破全都归功于“深度学习”，它是一种人工智能技术，利用深度学习技术，软件可以用无数案例学习，这些案例一般来自网络。

有了深度学习，在识别笔迹时计算机像人一样精准，计算机翻译系统正在快速进步，“文本-语音”系统不再那么生硬，发出的声音更加自然。总之，不论从哪方面来看，计算机处理自然语言的能力越来越强。

有了深度学习，机器识别语音的能力提高，说话的方式不再那么呆板，尽管如此，它仍然无法理解语言的意义。理解意义是最大的难题，如果语音计算想要流行起来，这一障碍必须克服。

计算机只有理解环境，才能围绕某一主题进行连贯的对话，现在的系统只能对简单的一次性命令做出回应。

大学、大企业和小企业的研究人员正在努力解决这一问题，它们开发可以完成精致对话、可以处理复杂任务的机器人，这些机器人可以检索信息，为抵押贷款提供建议，还可以安排旅行计划。

什么时候魔法才能替代拼写？

语音计算如何进化，消费者与监管机构也起到了重要的决定作用。虽然语音技术仍然处在原始阶段，但是它已经带来一些问题：当系统面向个人时非常实用，它可以获得大量数据，比如日历、邮件、其它敏感信息。于是乎，隐私与安全问题接踵而来。

许多语音设备一直在监听，随时准备激活，问题因此变得更复杂。联网麦克风装进了每一个房间和每一台智能手机，这种现状已经引起一些人担忧。并非所有语音都被送到了云端，当设备听到触发短语时（比如“Alexa”、 “OK,Google”、 “Hey Cortana”、 “Hey,Siri”）才会将用户的语音传输到服务器，然后开始处理问题。如果设备开始存储语音，我们根本不知道谁持有数据，存储了哪些数据，何时存储的。

警察曾经调查Arkansas（阿肯色州）凶杀案，案发经过可能被亚马逊Echo监听，警察要求亚马逊开放语音数据，方便查看。亚马逊拒绝了，它不知这样做是否合法。

2016年也曾出现过相似的事情，当时苹果拒绝帮助 FBI 破解枪杀案凶手的 iPhone。这两件事告诉我们：应该建立规则，让大家知道何时接入个人隐私数据、获得什么数据是合理的。

即使这些问题没有解决，消费者还是会接受语音计算技术。在许多环境中，语音方便得多，自然得多。当我们在做其它事时，语音最能发挥作用。因为各种原因，有时用户无法使用屏幕或者键盘，此时语音计算可以拓宽用途。

事实上，语音技术不只对计算造成影响，还影响了语言本身。对于大多人来说，要想说一门不懂的外语比登天还难，计算机模拟翻译工具可以解决问题。如果机器可以说话，小语种就可以存活下来。在人类与计算机互动的历史长河中，触摸屏是最近出现的一次变革，如果能向语音转移，变革的力度会更大。

本文来自翻译, 如若转载请注明出处。

[免责声明]

资讯标题：语音技术正在改变计算行业

资讯来源： 36氪官网