编者按:本文作者 Matt Galligan是一位创业者,他是 Circa 的 CEO 兼联合创始人,曾经创办过 SimpleGeo 和 Socialthing。本文是 Galligan为我们带来的 “Bot 大科普”。
Bot 时代真的到来了。它们无处不在,以Facebook Messenger 为例,Bot 被分派给 9 亿人,与人们聊天、帮忙解决问题。Bot 能帮你订墨西哥玉米卷外卖,也可能被网民调教成“种族歧视分子”。无论如何你要记住,不是所有的 Bot 都“生而平等”,它们往往有着不同作用,也有水平高低之分。现在,我们常常简化表述,用“Bot”来囊括各种各样的产品和创造。这样必然会造成误解,因此我认为有必要解释Bot 的定义,以及它们究竟能为我们做什么。
在介绍开始前,我想先引述一段维基百科上对于Bot 的定义:
在计算机科学领域中,软件代理(software agent)指的就是能够作为用户或其他软件代理的电脑程序。Agent 一词来自于拉丁语的 agere,指的是代表某人完成某件事。“代某人做出动作”的职责意味着软件主体有权进行适当的决策。在日常口语中,软件代理又被称为 Bot,来自机器人一词 Robot。
从基础词义上看,Bot 就是一个能触发某些动作的软件。最近 Bot 被频繁提及,往往与另一个细分类别相关——维基百科上叫它“聊天机器人(chatterbot)”,人们也会简称其为“chatbot”。这大概就是一个能模仿人类交流方式和语气与你聊天的电脑程序。
定义:Chatterbot,也被称为 talkbot、chatbot、Bot、聊天盒子(chatterbox)、人工对话实体(Artificial Conversational Entity),是指可以通过声音及文字与用户进行对话的电脑程序。
现在我们已经了解清楚 Bot 的定义和背景了,接下来就让我们看看近来大热的聊天机器人都有哪几个细分类目。
脚本 Bot
脚本 Bot,顾名思义,指的是以既有脚本为指引进行应答的聊天机器人。它们在对话中会使用到决策树模型。此外,基于用户与其交互的实际情况,脚本 Bot 会借由对话树来生产出结构化的回复。
有的时候,脚本 Bot 可能会使用自然语言处理来进行措辞,保证实现答案的完整性。通过对于可能性范围的研究,我们能提高自然语言处理的效率,并缩小机器需要掌握的词汇量。举个例子,如果你正在开发一个解决旅游和食宿相关问题的脚本 Bot,你可以将重点放在调教 Bot 上,或者说写下能识别相关词汇的程序脚本。与一味地添加各种可能遇到的词汇相比,这种方法会更加省时省力。
以一个正在做这类Bot 的团队为例。该团队名为 Assist,我是他们的产品顾问。近来我对这块实在太感兴趣了,所以我决定一定要深入其中。在几天前的 F8(Facebook 开发者大会)上,扎克伯格演示了在 Facebook Messenger 上如何向纽约老牌花店 1-800-Flowers 订购礼品。这个产品正是由 Assist 提供技术支持的。整个订花的过程都是基于决策树和预先写好的脚本进行。用户可以在一系列购买选择中快速切换,整个购买体验比起网页或应用端都简化不少。背后的 Bot 从未偏离过脚本运行,但是用户的期望会随着可能性范围的缩小而收窄。这样就能保证高质量的用户体验。
现在,我们考虑一下人们给出的回应偏离脚本的情况。如果 Bot 无法理解对方给出的回应,对话就会被无缝转移至坐在终端前的人工客服。他们会为用户提供任何可能需要的支持。
脚本 Bot 是聊天机器人中最为简单的一种,但也是许多商家迫切需要的。
人工智能 Bot
人工智能 Bot 或许是一种最常被谈论的,但是其现实发展状况并不太符合我们的预期。我们所期望的是:人工智能 Bot 能够高效处理我们丢给它的任意一件事。此外,AI Bot 的开发还需要解决另一个问题——通过“图灵测试”——这是一个由天才计算机科学家艾伦·图灵于 1950 年代提出的一个测试方法,借此可以区别人工智能给人的感觉是否真的能与真人相同。如果你想了解更多相关信息,可以观赏一下影片《机械姬(Ex Machina)》。
无论如何,于我而言,人工智能 Bot 能否通过图灵测试并不是最重要的。只要 Bot 能够充分满足用户的需求,用户并不会太在意他们的人工智能是否足够像真人。现阶段,大部分的 Bot 都不能通过图灵测试,不过几年前有个特别出色的 Bot 的确“骗”过了 33% 的测试者。
我们都知道 AI Bot 有着非常广阔的前景,但也应认识到一段时间内它们的实用性不会太高。最近人工智能领域实现了很多突破,尤其是在深度学习方面进步显著,但是其应用范围仍旧太过狭窄。
想象一下你需要学习一门语言中的所有词语以及它们的所有用法。这仅仅是单个词汇的层面,当它们被组合起来可能又会有更多的释义。这就是我们所说的“开放可能性 AI Bot”需要掌握的程度。无论如何,如果我们把对其的期望降低一些,在其最能发挥作用的领域深耕,或许能收获更佳的体验。就现阶段而言,一个能和你讨论“待会儿看什么电影”的人工智能 Bot 其实更有用处——比起你所期待的、无所不能的 Bot 来说。
尽管各团队都在努力发展真正的 AI Bot,我们面前还有几个等待被解决的大问题。这也是我们需要下一种 Bot 的原因。
协助代理 Bot
目前来说,最受欢迎的一种(或者说媒体曝光最多)的应该就是协助代理 Bot 了。简而言之,协助代理 Bot 是指将 Bot 作为最初回应实体,如果它不知道怎么回答,会将对话转移至真人,即人工代理处。
这类 Bot 的例子包括 Facebook M、Fin 以及 Clara。它们的目标就是尽可能仅凭机器满足用户的需求,只有当实在棘手的问题出现后才引入人工服务。无论如何,即便用户要求被转移至真人代理处,其回应也会被用作教育 Bot 的素材——无论是下一次如何更好地回应,或者至少理解用户的要求。通过长时间的积累,这类 Bot 的技能会变得越来越强,并逐步减少对于人力的以来。
尽管这一方法结合了人类和机器的智慧,也实现了良好的用户体验,其耗费的高昂成本依旧不容忽视。
我曾经看到有人向这些 Bot 提出极其复杂的要求,企图测试他们的极限。很明显,这时问题会被自动转交给人工代理。如“帮我找到环游世界的最便宜路线,中途停留时间要短、要至少覆盖七处最棒的建筑景观”之类的需求对于训练有素的 Bot 而言会十分简单,但对于人工代理来说就是个难解的问题。毕竟我们还没有将 Bot 训练到这个程度,所以现在这些任务还是得交由真人完成。
此外还有一些充满挑战的情境,比如当 Bot 需要与第三方进行沟通时。当你问 Bot“为什么我的电话费那么贵?”时,你一定是假设 Bot 能处理你的请求、发现账单高昂的根本原因。这时你又加了一句“你能把我的国际数据漫游服务给取消吗?”你依旧假设 Bot 能帮助你实现,但问题在于它并不拥有通讯服务供应商的 API 接口。这时 Bot 就得向真人代理求助了,通过他与电讯公司进行联系。
我们可以感觉到在 Bot 领域各公司竞争的激烈,大家都想造出最好的产品。无论是谁先实现这个目标,或者显著降低 Bot 对人力的依赖性,都能使用户体验更上一个台阶。Bot 会变得更好、更快、成本更低,而它背后的公司一定会成功,至少在他们瞄准的领域。
还有什么值得期待?
说实话,目前而言我只能想到这几种 Bot 的划分和讨论方法。如果你们想到了别的种类请在文章下方留言,我会很乐意进行推荐。
我很高兴能看到这个领域的迅猛发展。在我与 Assist 合作的这些日子里,我意识到整个科技行业都将 Bot 视作下一轮大趋势的方向——从之前的网页到应用,再到现在的 Bot 和通讯。去年我曾经写过一篇假想性文章,预测苹果发展的 UI 导向型通讯应用会是什么样。今天 Facebook 就发布了这样一款应用,与我想象中的十分接近。当 Bot 被融合到通讯平台中时,我们或许能解锁更多激动人心的可能。
Bot 的时代已经到来,我们应满怀期待。
注:本文译者 Alksy。