Google Brain负责人Jeff Dean谈机器学习、强化学习与增强学习

转载时间：2021.04.18（原文发布时间：2016.12.13）

370

转载作者：36氪企服点评小编

阅读次数：370次

编者按：本文由微信公众号“将门创业”（ID:thejiangmen）编译自Fortune，编译Agnes Pan，36氪经授权发布。

下次当你用Google搜索引擎或是地图寻找去电影院的路线时，要意识到在它们提供的相关信息背后，有一个“大脑”在工作，来确保你选择了最安全高效的路线。

当然，这个“大脑”并不是生物意义上的大脑，而是Google的Google Brain研究团队。这个研究团队自成立以来，已经开展了1000余个与深度学习有关的项目，在过去几年中为Google的许多产品提供了技术支持。通过深度学习，研究人员将大量数据输送到到被称为神经网络的软件系统中，让机器以比人类更快的速度，学习如何识别大量信息。

在Fortune的采访中，Google Brain的创立者与领导者之一——Jeff Dean畅谈了最前沿的AI研究，AI面临的挑战以及他们是如何在产品中使用 AI的。

在推动AI发展的过程中，研究人员面临了什么样的挑战呢？

Jeff：人类的学习过程有很多都发生在潜意识中，而非刻意而为，我们通过观察身边的世界，逐渐明白世间万物的规律。这在机器学习中也是很关键的一环，但还仍然是一个未解的难题。

所以您所说的潜意识学习指的是从观察和感知中学习，那如果电脑学会了感知和观察，是否就代表它们能解决一些更复杂的问题？

Jeff：没错，人类世界观的形成主要是潜意识学习的结果。当你还是个孩子的时候，你就开始下意识地观察这个世界，在这个过程中，你也许会接收到外界的一些针对性的信号，比如会有人告诉你“这是长颈鹿”或者“那是一辆车”。然而真正起到作用的是你的与生具来的心理模式，它会对这些星星点点的外界信息作出反应，并将信息内化。

在机器学习中，我们需要更多地去结合潜意识学习和针对性学习。就目前大多数机器学习系统的运作情况来看，我们离这个目标还有一段距离。

您能为我们解释一下AI中的“强化学习”这一概念吗？

Jeff：强化学习的意义是，你不一定知道你具体要采取什么行动，所以你通过选择一个你认为在特定情况下较好的方法，实行它，并观察之后事物会做出什么样的回应，来确定该情况下采取何种行动比较好。就像棋盘游戏，你可以针对对手的每一步棋做出回应。最后，你能在一系列棋局中找到某一步棋的最佳回应方式，并将它内化成一种积极的信号。

强化学习其实就是训练机器能在采取某种行动后，通过结果的好坏，来确定该行动的好坏。如今，这项技术在很多领域都得到了有效的运用。

我认为，强化学习面临的挑战之一是，有时候在采取行动时，你会有太广泛、太多的选择。和棋盘游戏不同的是，现实世界中，人类在处理很多问题时，都有着难以想象的广泛选择。然而在棋盘游戏中，因为规则的约束，你下一步棋的方式十分有限，而其带来的后果也十分明确，不是赢就是输。

但如果我的目的是要做一杯咖啡或者其他东西，我可以选择无数的方式和材料，且做出不同选择所带来的后果也很难预测。