编者按:机器对人类语言的理解一直都是前沿研究的难点,理解语言不仅是语音识别,还有语法、语境、语用、俗语等一系列的综合。一个很著名的例子是AI不能根据语境分辨“The book can't fit the suitcase because it is too small. ”的真正含义。人工智能要真正实现与人类的自由交谈,还有很长一段路要走。这篇原题为<Facebook Wants to Make Chatbots More Conversational>的文章介绍了Facebook在这方面做出的努力——他们为AI研究者提供了一个训练AI语言能力的专业平台,希望能以此加速聊天机器人的研究。
尽管在过去几年关于聊天机器人(chatbots)的讨论——关于它是如何革命性地改变了移动设备传达信息的方式,使网购和顾客服务变得更加简单快捷——一直不绝,这些人工智能应用软件始终不能很好地运用在与人对话上。这是因为要实现机器与人类之间的无障碍交流,研究还有很长的一段路要走。Facebook创造了一个训练机器人对话系统的共享平台,希望能藉此改变这个局面。
运用自动电脑程序的聊天机器人通常被用在顾客咨询服务上,或是充当智能手机上的私人助理。这些聊天机器人的对话通常是被提前编程好的,Facebook人工智能研究(FAIR)团队的主管Yann LeCun说。“如果你关闭编程功能,他们就不能很好地完成工作。”其他类型的聊天机器人则用于休闲目的,但不适用于明确的指令,他补充道,引用了微软去年在推特上推出的Tay AI的例子,Tay AI在它“学会”了发送有敌意的推文后被火速下线。LeCun说:
我们缺少那种能真正‘学会’什么有益的事情的聊天机器人。
LeCun和他的团队的工作是运用一个名叫ParlAI的软件来帮助程序员开发下一代智能机器人,在ParlAI的平台上,开发者可以得到共享、开放、互利的AI训练信息。开发AI的其中一个重要的目标是创造能与人类正常交谈的智能网络,Jason Weston说道,他也是FAIR团队中的一员。
现在的技术不到位是因为相关的研究领域在这方面仍有空白,比如让AI使用自然语言对话的算法还不到位。
ParlAI发布了20个不同的数据组,每一种研究者都可以用来训练AI对话系统完成一个特定的任务,可能是学习回答问题,或是收集相关信息(比如订餐任务)。其中一组,被称为bAbl任务,涵盖了20种不同的测试,用于衡量AI软件理解和推断文本的能力。Weston说,AI需要理解对方提问的是什么,并运用逻辑来回答问题。
LeCun说,一些数据组仅仅是测试,另一些则会涵盖图形和文本信息,为的是教会AI把词语与现实生活的中的对象联系起来。ParlAI设计的初衷就是为研究者提供一个训练和测试对话模型的统一的框架,特别是对于把多个数据组放到一起对AI进行多任务的集中训练,他补充说,“我们希望这种组合能够帮助机器一次性得到更多知识。”
在机器学习和对话系统上的强调已经成了领域内的共识,并非Facebook的研究人员,在MIT信息科学与人工智能实验室交互机器人小组的博士后研究员Brad Hayes说,
理解语言是一个非常宏大的话题,创造强功能性的聊天机器人不仅需要了解语言背后的意义,还需要机器人具备同时对相关的反馈进行反应的能力。
公开这些数据组能够让更多的研究人员参与进来,从而解决现有问题。但是Hayes表示,除了要将更多的训练数据纳入现有系统以外,要发展出更加成功的AI语言理解系统并运用到实际,科研人员还需要付出更多。现有系统的局限性很明显的体现在用户为了使聊天机器人比如亚马逊的Alexa听得懂自己的话,经常会使用更简单的表述方式。他说,“举个很贴切的例子,你可以问Alexa把音量调大或者调小,或是告诉它按1到10的量级进行设定,但是它听不懂百分比的表述,因为它的内部软件没有提前设定过这种说法。”程序员可能将重点放在猜测客户的用语上,而不是力图设计一个更自然的交互系统,这是我们目前AI发展的一个潜在风险。
Facebook试图解决这个问题的一个方法是允许ParlAI参与者通过与真人交互的方式来测试人工智能应用程序的对话功能,该机制是通过亚马逊机械通讯社(Amazon Mechanical Turk)来进行的,该机构是一个众包平台,人类智慧被用来执行计算机目前无法做到的任务聊天机器人和AI助理的能力取决于他们是如何被设计和训练的,这需要研究人员了解他们是如何与真人互动的,Weston说。
一个完善的聊天机器人发展策略对于技术的发展是至关重要的。当未来自动对话系统被应用到更加广泛的领域,聊天机器人对于未来信息传播和前沿服务会有更加重要的意义。Hayes说,“聊天机器人会极大地改进用户服务系统,节省公司的人力资源。但是如果在技术还未完全成熟之际就投放使用,也有破坏用户体验和品牌声誉的潜在可能。”
编译组出品。编辑:郝鹏程