作者| 田煦阳
编辑| 傅博
“三十五年前的计算机博士,可不会像现在一样受到各大AI巨头的哄抢。在那个就算利用算法,一天还是只能处理区区一张图片的人工智能最低谷时期,计算机博士可是一度被当成书呆子和nerd的典范。好在时代在一直变化,现在对于AI人才的激烈争夺简直残暴,可比我刚毕业那会不知高到哪里去了。”
在1980-1983年间仅花三年便于爱丁堡大学拿下计算机博士学位的Andrew Blake教授说了这么一句话。他目前在FiveAI,一家预计于2019年在伦敦街道上测试无人车的英国自动驾驶软件初创公司,担任技术顾问。
Blake教授曾是微软计算机视觉部的创始人,亦是位于剑桥的微软研究院的执行主任。他现在则在以计算机祖师爷阿兰图灵命名的英国阿兰图灵研究所(Alan Turing Institute)担任科研主管,涉猎机器学习、AI乃至人工智能和大数据的道德与社会问题等诸多领域,可谓是业内顶尖专家。
Andrew Blake教授
像FiveAI这种初出茅庐的创业者,有何秘密武器能在充斥着Uber、谷歌等巨头的市场中分一杯羹?
而像现在几乎所有大公司都选择投入全部精力来·力求人工智能方面的突破,对于全社会来说到底是危机还是机遇呢?
我们有着太多太多的疑虑与不解向Blake教授请教,希望能听一听先驱者的独到看法。而在这篇漫谈中,深耕计算机及图形处理领域三十余年的Blake教授,用他幽默风趣的口吻一一解答了我们的问题。
这是我们最为关心的问题之一,不过Blake教授的观点明显要比我们乐观不少:
“我认为现在整个人工智能的生态系统还是充满活力的,这要归功于才华横溢的科学家和大学生不断涌现的科研成果。现在在人工智能领域,无论你有什么好点子,只需要申请几项专利,便会有诸多大公司在门口排着队向你发出收购邀约。”
其实早在遥远的1999年,在开发出搭载交互式可视系统的机器人等颇具新意的发明后,他也曾认真考虑过创办一家属于自己的公司。不过他最后还是选择投靠微软,这样就可以一门心思搞科研,无需再分神费心商业开发和运作了。
“其实AI从业者的选择十分丰富,为大公司效力,创建自己的初创公司,亦或是留在大学里进行充满创造力的科研工作。对于很多人来说,其实后者最为激动人心也有着最强的吸引力。”
但这并不意味着科学家们全都身处高高在上的象牙塔,切断了与社会和业界的联系。实际他们很多人都会选择为一到多家公司提供技术支持,科研应用两手抓。
像由几位科学家创办的Geometric Intelligence就是一个鲜活的例子,成立尚不足一年便被Uber以优渥的报价并购,成为Uber的AI部门。
“现在人工智能的发展是如此迅速,就连一向较为保守的政府都迅速意识到了其对于创新和提升生产力的巨大价值。在该领域,培养训练大量的AI人才是奠定基础的关键一步。那我们有没有什么好办法来使人才井喷呢? ”
而在2015年由五所英国大学联合组成的图灵研究院,正好扮演了人工智能西点军校的角色。
Blake教授还认为Google、Amazon、微软等大量开源自家工具(如谷歌的TensorFlow机器学习框架)为创造更广阔更有活力的环境做出了值得肯定的贡献,但也不应被过分夸大。
“值得注意的是,很多时候无需复杂的团队结构,甚至无需科技巨头提供的海量资源,几位天才聚集在一起,找对方向,同样可以做出名垂青史的成就。”Blake教授对于AI领域的合作模式也提出了自己的看法,“运营庞大的团队相当复杂,有时当你要进行单点技术突破时,你真的会很希望化简为繁,带领一支小队完成任务。”
“总的来说,我认为这一良好的生态环境还将保持下去,焕发新的生机。”
“过去十年中,AI领域最大的突破当属深度学习的出现与完善,关于它的论文到现在还是层出不穷,但是我认为这已经是过去时了,”
Blake教授提出了一个不无大胆新颖的观点,“深度学习技术已进入了一个较为成熟的阶段,应用其完成项目变得相当普遍,但是若想理解深度学习的机制尤其是背后的数学原理则是另一码事了。”
“英特尔的研发成果不仅只包括核心的处理器,他们还为你搭建整个数据中心全面提供了上各式各样的十八般武器;而这些智能电元件又通过名为‘互连装置’类似电线的部件在数据中心内组装在一起。
这样,英特尔完全接管了整个系统的设计开发工作。图灵研究院与英特尔由良好的对话及合作,我们也在不断探索如何构建最有利与开展机器学习研究的数据中心。”
FiveAI团队
“目前最大的难题之一在于自动驾驶赖以生存的机器学习技术可靠度尚有欠缺。如果你细心浏览机器学习方面论文的话,你会发现在许多项目中,机器学习的可靠性已经达到了99%,即只有1%的时间会出现问题。
对于绝大部分人来说,这已经是十分喜人的成果并可进行广泛的应用。但是99%的可靠性对于无人汽车这种安全至上的领域来说,还差得太远;
1%的事故率?听上去太骇人了。安全问题绝不应该成为一个可有可无的细节,而是从最开始就贯穿整个科研流程的根本所在。我想一个十分有趣的可能突破口或许是将目前游兵散勇的各种算法集成起来,使它们团结协作来提升我们所追求的可靠性。”
Blake教授所供职的FiveAI的一大目标正是在不启用精准3D地图及定位的情境下,解决自动驾驶汽车在复杂城市环境中的安全问题。要知道,这一难题可是达到了五级无人驾驶的顶尖水平。
在AI创新是否一定要以个人隐私的牺牲为代价这个问题上,Blake教授并没有立刻给出答案。
目前盛传的观点是,不同于无孔不入,榨干所有用户数据最后一滴价值的Facebook和谷歌,在这方面较为人性化和收敛的苹果在AI军备竞赛中将自己摆在了十分不利的天然劣势位置之上。
对此,他直接给出了否定的回答:
“只要我们持续认真工作与思考,就算现在尚无头绪,更好的解决方案终有一日会浮现出来;技术的创新与隐私的保护绝非水火不相容。”
关于AI的黑箱特质使其难以监管的看法,Blake教授亦给予了较为否定的回复。他提到,算法可问责性(Algorithmic Accountability)的存在,对于确保人工智能的社会影响能被合理认知及监管,是至关重要的。
Algorithmic Accountability
他还认为对AI领域伦理问题的研究,尚处于起步阶段。
“近两年来,这一领域如透明性和公正性的实验与论文开始大量涌现,而该问题由于人们均已意识到其至关重要性,充满了紧迫感。”
“在图灵研究院,我们也开发了一个庞大的项目来探索AI中的伦理道德问题。我们一方面请来了哲学、法律方面的专家来听取他们对此的看法。
另一方面我们聚集科学来讨论如何将这些伦理道德准则编入算法之中。实际无论是从社会的还是从工程研发的角度,透明性都是一个十分关键的要素。当AI系统具备此特质后,以后无论哪里出了差错,我们都能及时找出问题,调整策略。”
“不过由于这一领域刚刚起步,我想科学家们对此的认知可能还不够深思熟虑,我们会保持密切关注,静观其变。”Blake教授相对保守地说道。
“此外,我们毫无疑问希望公众能尽可能地对这类新兴技术感到亲近,不产生抗拒之心。从过去由于没有迅速取得公众认可与支持导致失败的例子中吸取到足够的教训后,我们将尽快取得公众的信任。”
Blake教授十分认同与研究问题相关的海量数据在搭建AI算法中所扮演的核心作用。
“过去十年内技术的飞跃,很大程度上源于数据与日俱增的开放性,特别是在互联网上可以很轻松地找到自己所需要的数据。由此,正因有了大数据的辅助,我们才能更好地学习理解算法的构造过程”
而各大科技巨头覆盖面极广的庞大业务,犹如一块块自留地,为他们源源不断地提供海量数据。
比如Facebook,一天便可将数以亿计由用户生产的数据收入囊中进行科研。这正是大公司相较于新兴创业公司最大的优势所在,这一几乎坚不可摧的壁垒一直处于争议漩涡的中心。
对于数据的“贪婪”追求是无止境的,就连坐拥全球最大搜索引擎的谷歌都还在通过DeeoMind与诸多第三方机构达成合作,获取大量特定的高价值数据。一个例子是联手英国国家健康服务系统(National Health Service,NHS),获取数百万人的就医数据来构建优化医疗准断的AI项目。
其实对于AI来说,并非所有的输入数据都享有平等的价值。Blake教授相当感兴趣的一个课题直接与此相关:如何使机器做到在学习过程中,不依靠海量数据支撑,即可在无人监督情况下,提取总结对于数据有意义的认知。
“我时常沉醉于人类不依赖大数据便可完成学习过程这一神奇事实,”
“人类的学习模式实际还遥遥领先于目前机器学习的方式:对于蹒跚学步的孩童,尽管并不知道身边世界中所有事物的具体名字,但依然能较好地理解周遭发生的一举一动。如果冰冷的机器也能像这样从原始数据中提取最为重要的信息,加速学习过程,无疑会对人工智能的发展大有裨益。
为了更好地进行这一研究,我们有必要对数据的类型进行区分——未标注数据(即原始数据)和标注数据。相较于充斥在你人生经历中的种种未标注数据,标注数据的量要稀有得多,且获取代价更加高昂。
“如何将孩童的学习方式嫁接到AI中,使其仅应用十分有限的标注数据进行自我学习,“”Blake教授认为这将会成为等待科学家们的下一重大难题,“而如何以最有效强大的方式处理未标注数据?如何开发算法?对于现在的我们来说,这些还都是未知数。”
“也许重新回顾早期一些失败的尝试能给我们带来灵感与启发。人工智能领域最早的开拓者们选择应用逻辑与概率作为切入点,不过由于种种原因失败后,之后这一概念便被尘封许久。但是以逻辑为根本的最大的三个优势就是快、快、还是快。这一效率非常的方式或许会在未来成为一个重大突破口。”
不过Blake教授还指出,正如深度学习的成功几乎让整个业界全部大跌眼镜,预测AI的发展走向是十分困难,且反直觉的一个过程。
在访谈的最后,记者向Blake教授抛出了一个颇为发人深省的问题作为收官:
“在探索人工智能三十余年的生涯中,您有没有彻底洞悉人类自身的智力与认知模式呢?”
“哦,这个问题简直太复杂啦!”Blake教授最后给出的答案就是一段“哈哈大笑”。