编者按:本文来自微信公众号“量子位”(ID:QbitAI),维金 夏乙 编译整理,36氪经授权发布。
“苹果就是AI界的NSA。”
去年8月,资深计算机科学家、斯坦福大学教授Jerry Kaplan这样评价苹果。NSA就是美国国家安全局。
那时候,苹果还没有“AI Director”这个职位,没有从卡耐基梅隆招来Ruslan Salakhutdinov,也还没信誓旦旦地公开说要发表论文、要和AI研究界密切合作。
在人工智能研究界看来,苹果应该是一个异类,2012年以来,谷歌、Facebook、微软等硅谷巨头都大张旗鼓进入学术界,找顶尖高校合作、挖人、建研究院、发论文的时候,苹果的所有研发工作依然在偷偷摸摸中进行。
现在,一年多过去了,情况如何呢?
从去年开始,苹果一反常态,也开始尽可能地把自己在人工智能上所做的努力展示出来。
这两年,可以说是苹果“改革开放”的开端。
在苹果的一系列举措之中,最引人关注的应该是Ruslan Salakhutdinov的入职。
去年10月,苹果宣布将Salakhutdinov招入麾下,任AI主管。当时在AI研究界引起的波澜甚至不亚于2013年Yann LeCun加入Facebook、Geoffrey Hinton加入谷歌之时。差不多同一时间,苹果还在美国旧金山湾区举办了一场机器学习论坛:BayLearn 2017。
Salakhutdinov入职后两个月,就在年底的顶级学术会议NIPS 2016上搞了个大新闻:
他说,我们在苹果,也是可以发表论文的!
几周之后,说好的论文就来了。苹果在arXiv上第一次公开了自己的人工智能研究论文,提出用模拟和无监督学习来改善合成图像的质量。
在今年8月的计算机视觉学术会议CVPR 2017上,苹果这篇论文还获得了“最佳论文奖”。CVPR,可以说是计算机视觉领域最具影响力的大会之一。
苹果的“开放”举措还不止于此,今年1月,他们加入了Facebook、微软等公司都在其中的the Partnership on AI,想要和它们一起探索AI研究的最佳实践。
6月,苹果甚至还开了个官方博客,专门发布自己在AI研究、机器学习研究上的进展。
归根结底,一切都是为了招揽人才。
无论招揽大牛,还是入乡随俗地发表论文、开博客,都是为了能招到更多的人才。
对于任何一家科技巨头来说,人工智能的重要性和人才争夺战的白热化程度都明晃晃地摆在眼前,环视四周,谷歌、Facebook、亚马逊、微软这些坐拥几千亿美元市值的公司,都虎视眈眈。
而可供他们争夺的人,可能全世界加起来也不超过1万名。
这些人当然也不是靠三五十万美元年薪和一些股票就能搞定的。为了吸引他们的注意,大牛坐镇、论文堆积起来的学术声望、有吸引力的项目、以及自由的发展空间都是必须的。
苹果在这些方面的名声并不好。多年来,AI领域的从业者对苹果的认知都是“掉队巨头”,很大程度上是因为它对研究情况三缄其口。
按照那位把苹果比作NSA的Kaplan的说法,不像另外那几家硅谷巨头,苹果和AI学术圈走得不那么近。
△ NIPS 2016现场
曾跟随Salakhutdinov读博的Yuhuai Wu说出了一位AI研究者在找工作时最关心的事:“我最关心的是,(如果去苹果工作),我在学术界是否还有足够的存在感,能不能继续做我想做的研究。”
他说,如果苹果不发表论文,愿意加入他们的人才就会更少。
深度学习创业公司Skymind CEO及联合创始人Chris Nicholson也持类似的观点,他说,人工智能是一个由学者和研究员主导的领域。“这些人喜欢发表成果。论文发表对他们来说就像是呼吸:要么呼吸,要么就得死。”他表示,“因此,如果试图用很大一笔钱去招募人工智能研究员,同时将同行认可水平降低至零,那么你就无法走得太远。有些人因为这样的原因永远不会加入苹果。”
当然,也有一些人工智能研究员承认,关于是将你的研究成果发表,还是部署至全球的数千万台苹果设备,选择向左还是向右?这里一直都有争议。一名不愿透露姓名的人工智能教授表示:“许多人认为更应当去部署,而不是发表。我认为,两者都是合理的。”
对苹果这一年来的努力,研究者们似乎并不满意。
BuzzFeed News为此采访了几十位AI专家,他们认为,苹果还真的开放了一点点,但AI学术界所追求的价值和苹果做生意的方式,依然是脱节的。研究者们说,苹果特别执着于为自己的产品打造AI应用,对于那些(自认)天赋异禀、手握一摞Offer的AI专家来说,这可能没什么吸引力。
加拿大生物技术公司Deep Genomics研究员Shreshth Gandhi认为,苹果对待AI研究和态度和谷歌、微软、Facebook等其他巨头明显不同,“苹果为他们的AI新研究做的宣传似乎不太够。”
对于苹果的“机器学习博客”,学术界似乎不太看得上。
这个博客开设5个月以来,只发布了7条与Siri、人脸识别、手写识别和文本标签有关的内容。所有这些都表明,苹果的策略是以产品为中心。更重要的是,这些内容只列出了苹果的团队,而不是研究员个人。这与人工智能行业其他同行评议的期刊截然不同。
一位来自某精英大学、不愿透露姓名的人工智能教授表示:“这个博客毫无用处。”
例如,在关于手写识别人工智能技术的文章中,苹果完全没有提供细节。其中只是吹嘘,实际上研究人员无法从中学到任何东西。给人的感觉就像是,他们意识到知名机构都有博客,因此自己也要开一个,但具体做法却没有带来任何价值。你可以与谷歌用神经网络去实现语言理解的论文相比,后者有更多细节,并指向了公开的代码和逐行的注释。
对于上周四苹果发布的有关面部识别的最新文章,这名教授表示:“不算太坏。苹果仍然没有公布代码,但这次还行,不能说是又一篇愚蠢的文章。他们正在改进。”
在发论文这件事上,苹果也无法与同行们相比。
除了拿下CVPR 2017“最佳论文奖”的那一篇之外,在arXiv上只能找到3篇来自苹果的论文,加起来,苹果这一年多来的论文发表总量是4篇。不过苹果说,去年8月他们在瑞典的ISCA Interspeech大会上发表了3篇经过同行评议的论文。
按照学术界的看法,经过同行评议,能够正式发表,的确比arXiv要高级。不过,我们还是要看看其他科技巨头发表论文的数量。
Facebook说,他们2016年在arXiv上发了125篇论文,2017年估计会发200篇;微软2016年发了847篇AI相关论文,今年截至8月一共发布了394篇;谷歌说他们到现在还没统计过2017年的数据,但之前三年分别发布了113篇、171篇、203篇,今年应该还会保持类似的增长率。
谷歌发言人表示,该公司目前还没有统计2017年的数据,但2014、2015、2016年发布的人工智能论文数分别为133篇、171篇和203篇,而2017年的趋势也会类似。
康奈尔大学人工智能教授Bart Selman表示:“在人工智能领域,你必须在有同行评议的主流人工智能、机器学习、计算机视觉和自然语言大会上发表论文。”他列举了这样的大会,包括NIPS、ICML、IJCAI、AAAI、CVPR和ACL。“其他科技巨头每年在这些大会上起码要发表数十篇论文,因此苹果还有很长的路要走。”
在这些大会中,苹果仅仅出席了ICML和CVPR。(Slakhutdinov出席了2016年的NIPS大会,宣布苹果计划开始发表论文,但苹果在当时的大会上并没有展示任何研究成果。)
一些研究人员表示,在人工智能的开发过程中,苹果以业务为优先的做法与人工智能研究社区探索新概念和新科技的方式完全不同。
提到苹果,一位曾经在苹果工作过的AI工程师回忆起了当时环绕在他工作周围的保密气氛。这位工程师说,对于公司的一个项目,他们只能了解到完成工作所必须的那一部分。
“通常是在一个10人团队里,5个人了解某一个项目,另外5个人不了解,所以你可能会坐在一个人旁边,和他一起工作,但是他了解你所不知道的信息,你也了解他所不知道的信息。”这位苹果前工程师认为,这样“会引发一种不好的感觉,因为你看不到大局,不知道自己到底为什么在做这些事。”
当然,他所描述的是两年前的情况,当时还是苹果的保密工作做得做好的时期,不过这些描述的确说明了苹果公司的文化曾经有多么封闭。
Gandhi也讲了一个朋友的故事:“我的一位朋友与苹果曾有过招聘互动,关于如果加入那么会去做什么工作,苹果拒绝告诉他甚至是最模糊的想法。我认为,这种保密的做法与人工智能社区的开放研究文化是背道而驰的。在这里,大学和企业的大部分研究都是被分享的。”
苹果对隐私的强调也对人工智能研究造成了限制。在2016年的苹果开发者大会上,苹果率先大规模应用了一项研究性技术,即“差异化隐私”。简单来说,这就是苹果可以大规模分析用户数据,同时不获取关于个人的任何信息,例如用户通过iPhone访问网页的什么内容。“
在很长一段时间里,苹果只能从用户那收集少量数据。而使用差异化隐私技术,苹果可以在不改变基本协议的情况下收集更多用户数据。”Bretschneider表示,尽管外界很难知道,这种策略是否有助于苹果人工智能技术的开发效率,但很明显苹果在人工智能方面的努力“更有目标性、更受限制”,而类似谷歌的公司则更希望成为人工智能公司。
为了进一步加强隐私保护,苹果还将大部分用户数据保存在用户手机上,并在几个月后删除。
普渡大学关注机器学习硬件的教授Eugenio Culurciello表示,尽管人工智能的片上处理能力要比以往更强,但性能限制和存储带宽仍然会导致移动设备无法匹敌云计算模式的人工智能,而谷歌和亚马逊正在采用后一种方式。(这些公司会一直保存数据,除非用户明确要求删除数据。)
Skymind的Nicholson表示,从本质上来看,苹果不得不接受商业模式带来的劣势。他表示:“苹果处理信息的方式导致人工智能的发展步履蹒跚。”
苹果非常认真地对待用户隐私,而苹果可能是硅谷最喜欢这样的做的一家公司。这样的定位是由于,苹果是一家硬件公司,不会像Facebook和谷歌一样,商业模式以广告为基础,利用用户数据去销售广告。
但这也意味着,苹果很难从“数据效应”中受益,即利用收集的大量数据去改善产品。Nicholson表示:“人工智能受益于数据效应。这需要大量数据。一旦你掌握了大量数据,那么就可以开发更优秀的产品,吸引更多用户,进而为人工智能的发展获取更多数据,形成良性循环。”苹果则无法完全参与到这样的循环之中。
苹果对此的回应是,对该公司而言,正确的数据比更多数据更重要,而且该公司对于目前的数据收集方式感到满意。
苹果是一家非常成功的公司,并且是全球市值最高的上市公司、全球店面坪效最高的零售商,以及全球最赚钱的公司。然而,大公司的崛起和衰落史告诉我们,不可能有人永远成功。如果专家们的看法是正确的,那么当前最成功的公司将会开启人工智能的发展,而这种技术已经准备好变革人类的各行各业,无论是医疗、金融、劳动力,还是艺术。
Nicholson表示:“苹果并没有向世界展示它在人工智能领域的领先地位。苹果的策略意味着,该公司无法掌握人工智能的未来。”