编者按:从应用角度来说,2016年无疑是深度学习之年。机器翻译、聊天机器人、数据中心、云服务,包括Google、Amazon、Facebook、微软、IBM在内的各大技术巨头都在不遗余力地推进深度学习的研发和应用。未来这种技术将渗透到每个人的日常生活当中,对世界产生深远影响。《连线》杂志用一篇文章概括了深度学习在2016年所取得的进展。
在澳大利亚的西海岸,Amanda Hodgson正在朝着印度洋发射无人机,以便在水面上方拍摄照片。这些照片是定位珀斯附近海湾的儒艮,或者叫做海牛的一种手段——这是防止这些濒危海洋哺乳动物走向灭绝的努力的一部分。麻烦的是Hodgson和她的团队并没有足够的时间来检查所有的航拍照片。照片太多了,大概有45000张,而且未经训练就想识别出这些儒艮是非常困难的。于是她们把这项工作交给了一个深度神经网络。
深度学习正在重塑Google、Facebook、微软以及Amazon。
神经网络是一种机器学习模型,它能识别发布到你Facebook新闻流的照片里面的人脸。它们还能识别你向Android手机提出的问题,并且帮助运营Google搜索引擎。这些广泛的数学模型基本上是仿照了人脑的神经元网络来进行建模,它们会通过分析庞大的数字化数据来学习一切。现在珀斯莫道克大学的海洋生物学家Hodgson正在利用同样的技术,在开放水域的成千上万张照片中寻找儒艮,跟Google内部机器学习服务的底层基础一样,她的神经网络采用的也是开源软件TensorFlow。
正如Hodgson解释那样,检测这些海牛的任务需要一种特别高的精确度,这主要是因为这些动物是在海洋表面之下进食的。她说:“它们看起来会亿多白浪花,或者水面的一道炫光。”但现在神经网络已经可以识别分布在那片海湾的80%的儒艮。
该项目仍然处在早期阶段,但它足以反映出过去1年深度学习的广泛影响。2016年,这种非常古老但又焕发新生的强大技术帮助Google的机器击败了围棋这种古老的棋类游戏的全球顶级选手之一,这项壮举在几个月前似乎还是不可能的事情。但这只是最显眼的例子而已。随着新年临近,深度学习已经不仅仅是可以用来炫耀一下的小把戏而已。它不是小众的研究。它正在彻底重塑着像Google、Facebook、微软以及Amazon这样的公司,并且部分拜这些互联网巨头提供的开源软件以及云计算服务所赐,深度学习正在迅速向全世界的其他地方扩散。
新的翻译
在之前几年的时间里,神经网络通过Google Photo等app重塑了图像识别,它们也通过Google Now和微软Cortana这样的数字助手把语音识别带到了新的高度。今年,它们实现了机器翻译,也就是自动将语音从一种语言翻译为另一种语言的能力的巨大飞跃。今年9月,Google推出了一项名为new service it calls Google Neural Machine Translation的新服务,这项服务完全是通过神经网络运营的。按照该公司的说法,这一新引擎把特定语言对之间的翻译错误率降低了55%到85%左右。
Google通过提供大规模现有翻译样例来训练这些神经网络。这些训练数据部分是有瑕疵的,其中一些来自于Google Translate app之前版本的一些低质量的翻译。但是它也吸收了人类翻译的一些翻译,这些加在一起支撑着整个训练数据的质量。战胜不完美的能力是深度学习显而易见的魔法之一:只要给够它数据,即便数据存在瑕疵,它也能被训练到远胜出那些略有瑕疵的水平。
Google这项服务的首席工程师Mike Schuster乐于承认自己的作品远还没有完美。但它仍然代表了一种突破。因为这项服务完全是基于深度学习运行的,这对于Google来说继续改进这项服务会容易很多。它可以把精力集中在对系统整体进行调优上面,而不是去折腾众多在过去属于机器翻译服务的小地方上。
与此同时,微软也在朝着同一个方向发展。2016年的最后一个月,它发布了一版Microsoft Translator app,这个版本可以将大家之间的即时会话翻译成多达9种不同的语言。据监管微软AI和研究部门的副总裁Harry Shum透露,这个新系统也几乎是完全基于神经网络运行的。这一点很重要,因为它意味着微软的机器翻译可能也一样可以更快的速度加以改进。
新的聊天
2016年,深度学习还渗透到了聊天机器人里面,其中最显著的是新的Google Allo。2016年秋天发布的Allo可以分析你收到的文本和图片,还会即时推荐可能的回复。这是基于Google之前的一项名为Smart Reply的技术开发的,后者对于电子邮件消息基本上也能做同样的事情。这项技术工作得出奇的好,很大程度上是因为它考虑到了当今的机器学习技术存在的局限。建议回复非常简明扼要,而且app推荐的回复永远都不止一条,因为它知道目前的AI并不能总是把事情做对的。
在Allo内部,神经网络还帮助回答你向Google搜索引擎提出的问题。它们帮助公司的搜索助手理解你问的是什么,并且帮助做出回答。据Google研究产品经理David Orr说,该app聚焦问题的能力如果没有深度学习的话是不可能实现的。他说:“你需要利用神经网络——或者至少这是我们找到能做这件事情的唯一方式。我们必须利用手头的一切最先进的技术。”
有一件事情是神经网络做不到的,那就是推进一场真正的对话。不管技术公司CEO在主旨演讲上面做出了多大的承诺,实现这类的聊天机器人还有很长一段路要走。但是Google、Facebook等公司的研究人员正在探索有助于达到这一崇高目标的深度学习技术。其希望是,这些努力可带来跟我们在语音识别、图像识别和机器翻译上面所看到的的同一类进展。会话是深度学习的下一个前沿阵地。
新的数据中心
今年夏天,在开发出攻破围棋游戏的AI之后,Demis Hassabis和他的Google DeepMind实验室披露,他们还开发了一个AI来帮助运营Google部署在全球各地的计算机数据中心网络。通过利用一种名为强化学习(这是围棋AI AlphaGo以及DeepMind更早开发的掌握老的Atari游戏的服务的基础)的技术,这种AI可以确定什么时候打开遍布这些数据中心的成千上万计算机服务器内部的冷却风扇,什么时候该打开数据中心的窗户以获得额外的制冷,以及什么时候需要求助于昂贵的空调。这一AI总共控制着每个数据中心内部超过120项功能。
据彭博社报道,这种AI的效率非常高,高到可以替Google节省数亿美元的运营开支。换句话说,这已经把Google在2014年收购DeepMind的6.5亿美元给赚回来了。现在,DeepMind打算往这些计算设施添加更多的传感器,这样就能收集到额外的数据,然后把这种AI训练到甚至更高的水平。
新的云
随着技术巨头把这种技术推广到自己的产品和服务,互联网巨头还在把它推广到其他人的手上。2015年末时,Google开源了TensorFlow,过去这一年里,这个一度的专有软件早已在墙外遍地开花,成为了Amanda Hodgson这样的人有力的工具。与此同时,Google、微软以及Amazon开始提供云计算服务来提供他们的深度学习技术,任何编码者或者公司都可以用来开发自己的app。人工智能即服务有可能最终会成为这三大网络巨头最大的业务。
随着AI的演进,计算机科学家的角色也在发生变化。
在过去12个月的时间里,这个蓬勃发展的市场刺激了又一场AI人才争夺战。Google招聘了AI研究界最知名的人物之一,斯坦福大学教授李飞飞负责一个新的专门为AI服务的云计算部门,而Amazon则挖来了卡内基梅隆大学教授Alex Smolna在其云帝国内部扮演一个相同的角色。大玩家正在以尽可能快的速度抢夺全球的顶尖人才,让别人几乎一点机会都没有。好消息是,这些人才至少还把自己开发的部分技术成果分享给了想要的人。
随着AI的演进,计算机科学家的角色也在发生变化。当然,这个世界还会需要能写软件的人。但它还将越来越需要懂得训练神经网络的人,这是非常不同的一种技能,它更需要从数据折腾出结果,而不是自己开发某个东西。像Google和Facebook这样的公司不仅在招聘新型人才,也在对自己的现有员工进行这一新未来的再教育——在这个未来里,AI所定义的技术将几乎影响到每个人的生活。