编者按:本文由微信公众号”新智元“(ID:AI_era)编译,36氪经授权发布。
来源:zdnet.com
作者:Natalie Gagliordi、Teena Maddox、Conner Forrest
译者:徐小芹、胡祥杰
Zdnet 网站推出机器学习平台横向比较系列文章,以下内容分析谷歌、百度和 IBM 三家大公司 AI 实力,以及是否适合作为你的机器学习平台。谷歌的机器学习平台的优势在于构建更广泛的研究社区,围绕机器学习和民主化机器学习工具和服务的业务。作为在中国对标谷歌的百度,其 AI 平台是百度大脑,并开源机器学习平台 PaddlePaddle,在语音识别和深度学习知识经验方面占有优势。IBM的机器学习平台则以Watson解决方案为核心,实力来自三个关键因素:IBM研究、收购实力及其咨询顾问能力。
(文/Natalie Gagliordi)谷歌的机器学习产品包括一系列的云服务和工具。2015年,谷歌通过开源其机器学习库 TensorFlow,进一步扩大了其产品的市场占有率。TensorFlow 现在已经是 GitHub 上最受欢迎的机器学习项目,贡献者大部分来自谷歌公司之外。
TensorFlow 之后,谷歌云平台发布了一套基于谷歌预训练机器学习模型的专门的机器学习 API,谷歌云机器学习产品经理 Rob Craft 称这套 API 旨在为开发人员提供高质量的认知服务接口。这套 API 集包含机器翻译、云视觉、自然语言、语音以及工作API。
谷歌云机器学习服务允许用户创建神经网络和算法模型,且可以运行大规模的预测,而不必担心基础架构的限制。该服务使用了多个谷歌云的数据分析工具,例如 BigQuery、DataFlow 和 Datalab。
谷歌也利用机器学习来为自己的基础架构提供支持。Craft 说:“例如,我们使用机器学习使我们的数据中心冷却所需的用电量减少了 40%,这位我们的用户带来了成本效益,以及为地球带来环保效益。”
使用谷歌机器学习平台获益的企业之一是 Evernote。这家笔记服务公司9月份宣布将它的基础架构转移到谷歌云平台,根据其 CTO Anirban Kundu 的说法,效果远超预期。Kundu 说,Evernote 现在使用了谷歌的语音-文本转换服务、翻译API、自然语言API和机器学习托管服务。
挑战与伦理
虽然大多数机器学习企业都会遇到 AI 和机器学习系统开发中的技术障碍,但谷歌面对的挑战更微妙。以谷歌的搜索团队为例,该团队发现机器学习系统只需几个月的工作就能显著提高搜索效果。Craft 说:“难点在于说服这个团队去和机器学习的专家商讨,这是有关文化的问题。技术本身只是一个方面,但搜索是谷歌的一项重要服务,要考虑文化的因素。”
在伦理道德方面,谷歌是 AI 安全研究和道德讨论的积极推动者。谷歌与亚马逊、Facebook、IBM以及微软建立了合作伙伴关系,以向公众普及 AI 知识。谷歌还与 OpenAI、斯坦福大学以及伯克利大学合作,进行 AI 安全方面的研究。
优势与远见
根据 Craft 的说法,谷歌的机器学习平台的优势有两部分:围绕机器学习构建更大的研究社区,以及使机器学习工具和服务民主化。“谷歌对机器学习方面的研究团队进行了大量投资,”Craft 说,“培育更广泛的机器学习社区有利于加速技术的普及和突破,提高其改变世界的潜力。”
这种开源策略与谷歌决定使用其公共云基础架构进行机器学习密切相关,使用公共云有助于降低成本和对架构专业知识的需求,同时提高可及性。Craft 说:“使用公共云使我们能为用户提供最新的服务和技术的最新进展,例如无障碍改进现有产品,以更快的速度提供新服务,并且无需用户付出额外成本去支持必要的基础架构。”
谷歌机器学习的另一强项是大量的数据和强大的计算能力。Gartner 机器学习和数据科学研究副总裁 Alexander Linden 说:“数据和计算架构是机器学习和AI的关键,谷歌的强项也正在于此。”
展望未来,谷歌对机器学习和人工智能的远见在于,随着技术的普及,社会和经济都将发生积极的变化。“机器学习推动云计算的下一波浪潮,”Craft 说,“我们相信未来机器学习将为许多不同的行业带来好处。我们的下一步是为特定行业的使用案例创建更深入的、定制化的深度学习模型,我们期望继续为每个人提供产品和服务。”
(文/Teena Maddox)百度经常被称为“中国的Google”,但在美国,技术界之外鲜有人知。百度是一家搜索巨头公司,2015年收入达到102亿美元。百度在2015年的研发投资达到16亿美元,比2014年增长46%,其中增加投资的重头是人工智能。
百度副总裁兼首席科学家吴恩达(Andrew Ng)说:“AI 是百度的 DNA。AI 的最新进展加速了我们的研究进展,扩大了 AI 的影响力。”吴恩达是百度研究院硅谷实验室的负责人,负责该公司的研发工作。百度研究院下有三个研究实验室,专注于 AI、大数据和深度学习。百度 AI 团队有 1300 多名研究员,其 AI 平台是百度大脑(Baidu Brain),并开源了机器学习平台 PaddlePaddle。百度的开源基准测试工具 DeepBench 可用于评估跨平台的深度学习性能。
百度的优势
吴恩达说,百度的优势之一是其在深度学习和语音识别方面的经验,以及百度搜索引擎带来的巨大的数据量。吴恩达解释说:“百度是世界上少数几家能够得到大量数据的公司,现在 AI 的领先优势转向了高性能的计算。”称百度是世界上最先建立深度学习处理器的公司之一。
分析公司 Forrester 认为百度是 AI 市场不容忽视的强大参与者,特别是其公共云平台具有强大的竞争力。Forrester 分析师 Charlie Dai 说:“作为中国 PaaS(Platform As A Service) 的最先参与者,百度云扩展了许多应用服务以支持更多语言,提供多种基础架构服务。百度云也具有基本的存储服务,提供BI分析服务和具有设备认证等功能的loT服务。百度云在机器学习方面的产品路线图相当强大,也有为优化其大数据服务组合的数据分析服务和其他loT服务。”
百度的潜在劣势
虽然百度在中国是领先的科技公司,但在美国,除了技术界人士,很少人知道百度。分析公司 Moor Insights & Strategy 的首席分析师 Patrick Moorhead 认为,百度在中国之外的低存在感是其最大劣势之一。
Forrester 的 Dai 补充道:“百度在机器学习领域拥有相当深厚的知识、经验和人才储备,但该公司需要更好的市场战略来加速其生态系统的扩张,特别是在企业空间里的扩张。”最近有关百度的负面新闻使该公司形象受损,也是潜在的劣势。
自动驾驶汽车
2015年12月,百度成立了自动驾驶汽车研发部,使用自己的深度学习算法 Baidu AutoBrain。该公司在今年1月开始内部测试自动驾驶汽车,10月份进行了一次公开测试,用一支18辆全电动无人车组成的车队运载200多名乘客行驶了3.16公里。该公司计划在2018年公开推出自动驾驶汽车,到2021年实现批量生产。
此外,百度还与英伟达合作,为其他汽车制造商创建基于AI的自动化汽车平台。英伟达汽车业务高级总监 Danny Shapiro 说:“英伟达和百度在AI领域已有悠久的合作历史,百度吴恩达等研究人员已使用GPU取得了一些关键的突破,使得现在AI成为热潮。在利用AI使社会更美好方面,百度和英伟达的目标一致,我认为我们的合作能实现更多的未来图景。”
安全和伦理
吴恩达说,AI和机器学习的安全和伦理问题是百度重视的问题,因为未来将没有哪个行业完全与AI无关。“我认为AI是新的超级力量,”吴恩达说:“AI是新的电力。两百年前还没有电这样的东西,没有电话,没有电灯,也没有冰箱。大约100年前电开始出现,就像我们今天看到的一样,电不止改变一个行业,而是颠覆了几乎所有行业。我们认为AI也将如此重塑一个又一个行业。在这个意义上,AI就是超级力量。我们的团队对我们利用AI所做的事情,以及所不做的事情都是深思熟虑过的,我认为一些对人工智能的恐惧、对毁灭性机器人的想象都是过于夸张的。”
吴恩达说他相信AI能够解决世界上现存的一些问题。例如,自动驾驶汽车将能够拯救数百万人的生命,AI支持的更准确的医疗数据分析同样能够拯救数百万人的生命,而语音识别的应用将使人们的生活更轻松。
吴恩达对AI的未来相当乐观。他说:“我们很多人仍然不得不做一些毫无挑战性的重复工作,我认为AI将从心理上减轻人们的痛苦,就像工业革命把我们从繁重的体力劳动中解放了出来。”
(文/Conner Forrest)以下讲述的是IBM 如何在人工智能上开始的,他们如何把这一技术带到了你的业务或者组织台面上。
虽然几乎所有的科技巨头都在人工智能和机器学习上下了很大的力气,但是几乎没有哪家公司能够获得像IBM一样的关注度。2011年赢得Jeopardy 比赛后,IBM Watson就已经成为了认知计算和 AI 的代名词。
在输给Watson后,Jeopardy 前冠军 Ken Jennnings 曾写过一句著名的话:”我,作为个人,欢迎我们的新计算机统治者“。忽然之间,Watson变成了一个王者的名字,关于AI 能做什么,激起了大量的讨论。
虽然Watson 是 IBM AI 道路上的一个重要组成部分,但它其实只是整盘棋的一颗棋子。下面是关于IBM AI 更广泛图景的一次深入介绍,如果 IBM 可以成为正确的AI方案提供商,那么他们也许可以重新定义商业。
历史
IBM 研究院作为整个公司的研究部门,最早要追溯到1945年,当时,IBM 在哥伦比亚大学建立了Watson 科学计算实验室。根据其官网的介绍,IBM 从20世纪50年代年开始研究AI。当时,IBM 一位名叫Arthur Samuel 的雇员写了一个自学习的程序,用来下西洋棋。这可能是AI 和机器学习的先锋之作。
20世纪70年代,IBM 开发了公司的第一个机器人,并在80年代凭借 IBM RS1 进一步深入这一领域。20世界90年代,IBM 研究员 Gerry Tesauro 使用强化学习(RL)开发了一个可以自学习的西洋双陆棋戏程序。随后,1997年,IBM 的深蓝击败了国际象棋世界冠军Garry Kasparov,一战成名。
IBM 真正的人工智能产品研发更多是最近才开始的。Forrester Research 的 Mike Gualtieri 说,IBM 的人工智能解决方案之路开启于2009年,当年,IBM 收购了两家公司 ILOG 和 SPSS。Gualtieri 说, ILOG 是一个业务规则引擎,也就是曾经的专家系统,而SPSS提供的是高级的数据分析。这两比收购都为 IBM的商业AI 解决方案开发提供了帮助。今天,IBM的AI创新主要都围绕Watson 平台在进行。数据分析、机器学习、数据搜索和发现以及对话工具比如聊天机器人都有相应的Watson解决方案。
愿景
IBM把AI看成是“增强智能”,IBM研究院认知计算副总裁兼首席科学官Guru Banavar说。为了进一步理解这个概念,451 Research 分析师尼克·帕特森(Nick Patience)将增强的智力解释为“人工智能 ——特别是机器学习——是人类的力量乘数”。
Banavar表示,目前,有数以千计的工程师在Watson平台上工作。在较高水平的层次上,团队分成两个非常独特的阵营。其中一个着眼于“非常具体,商业开发和部署”,周期通常是周,月或季度。
“然后,另一方面,我们有许多人正在研究先进的新技术,甚至一些数学家也正在为这些发明开发潜在的技术,” Banavar 说。 在Watson赢得Jeopardy之后,Banavar说,IBM的团队专注于为特定客户或行业利基构建定制系统。然而,他们最近不得不做出一个目的明确的战略决定,从这个模型转向聚焦API。
Banavar说,IBM意识到,既有的战略不可能让他们构建想要的所有应用程序。因此,他们将一些功能转变为一个带有开放API的平台,“其目的是吸引和培养一个更大的开发者生态系统,进而构建许多IBM不能自己构建的应用程序,”Banavar说。 这些API正被用于零售,金融,法律,甚至虚拟足球游戏等领域。但医疗保健是沃森解决方案的主要焦点之一。 “我可以看到一个愿景:每个医院,每个临床组,都有这个Watson服务。它变得与X射线一样重要,和核磁共振成像一样是必不可少的,”Gualtieri说。 “所以,我认为这是他们的愿景,他们投入了很多。
优势
要了解IBM是否适合您的组织,你必须权衡公司的需求与IBM的优势。在技术方面,Banavar说,这些优势从Watson的语言能力开始。 “Watson有图像处理能力,语音处理能力,定期数值数据分析能力等等 ,我们有全面的覆盖,”Banavar说。 “但是,如果你问我什么是真正独特的,也许是最先进的。是语言处理。 谈到业务时,IBM的AI实力来自三个关键要素:IBM研究,收购实力和顾问。
IBM 研究院可能不会总是产生突破,但它确实给公司带来了独特的优势,Gualtieri说。 “这样做的优势是,世界上最大的公司 ,也就是IBM的目标客户,都想要这个优势,”他补充说。
收购合适的公司以扩大IBM的产品组合的能力是关键, Banavar指出,该公司还利用开源库和工具包来利用神经网络,字嵌入等新技术。 除了研究实力和收购预算之外,IBM还有一个庞大的顾问网络。据Patience说,这是关键,“因为很多早期的机器学习机会都涉及采用把技术,例如机器学习算法,转变为增强的业务流程和应用程序。在这些方面, IBM的理解很好。
挑战
IBM面临的最大挑战之一是处理好人们对认知计算和AI等术语的期望。由于Watson面向公众的性质,特别是在它在Jeopardy获胜之后,这种情况更加复杂。 “每个人都认为我们正处在星际迷航的边缘,就像下周就会实现一样,”Gualtieri说。所以,IBM必须对AI的未来有一个宏伟和变革性的愿景,同时他们还必须保持消费者的期望,以便客户不后悔前进,Gualtieri指出。
关于安全和伦理问题,许多人都会同意Gualtieri的观点,那就是:技术“甚至还没有法子到安全和伦理问题值得人担心的地步“。然而,Banavar说,道德挑战仍然是IBM团队必须考虑的问题。
巴纳瓦尔说,必须解决的第一个关键问题是可解释性。例如,如果医生或财务顾问使用Watson做出决定,他们必须能够理解为什么Watson选择了一个特定的解决方案或一组选项。 另一个伦理考虑是偏见。使用机器学习系统,模型是用训练数据构建的,但是数据必须忠实地代表你想要建模的东西,它可能有偏见,Banavar说。因此,选择适当的训练数据集是最重要的伦理决定。
参考阅读1,参考阅读2,参考阅读3