今年 7 月,英语流利说高调发布了他们的第一个课程类产品:懂你英语。在推出懂你时,流利说的 CEO 王翌曾表示,以深度学习为核心的 AI 技术的突破,让语音识别、个性化学习等都有了足够的发展空间。而技术也一直是流利说团队的专长,最近他们把这些技术应用到了雅思领域,发布了雅思流利说产品。
流利说的 CPO 翁翔坚表示,语言培训是一个相对拥挤的赛道,但大多数产品都要求老师在固定的场景下给学生授课,改变的是市场关系,而流利说的初心是帮助成年人更好地学习英语,从生产力的角度解决问题,降低老师在整个生态系统中的作用和边际成本。
之所以进入雅思领域,翁翔坚告诉 36 氪,主要是流利说看到了雅思考生的核心痛点,他们在考试前需要大量培训和模考,培训市场已经是一片红海,而模考却很少有人涉及,其中的难题在于口语模拟成本巨大:一种方式是找雅思前考官(一般来说现考官不能涉及参与考前培训),而线下面授的收费较高、次数有限;另一种方式就是自己录音,然后把录音发送给口语老师,但是这种方式缺乏实战感、时间成本较高。
如果模拟出一个真实的雅思考官,这个问题能不能得到解决呢?
流利说团队最新推出的“雅思流利说”,就是一个基于深度学习和深度神经网络的产品。按照雅思口语考试的三个部分,雅思流利说模拟出的考官会和学生进行对话,然后由机器从词汇、发音、语法、流利度四个维度进行判断。因为雅思口语分数会受主观影响,因此雅思官方有一个误差标准,一般在误差标准范围内的人为判分准确度在 92%。翁翔坚表示,目前流利说能将这个结果提高在 96% 左右。除了分数外,AI 算法还会提供一份详细的评估报告,列出需要特别注意的单词和语法项。
在之前流利说的产品中,文本都是给定的,因此不需要做语音识别,而雅思流利说的难点在于,用户可能会表达任何内容,尤其是自由阐述主题的 Part 2 部分,因此需要先转化成文字再做识别。流利说的首席科学家林晖表示,因为很多用户的口语水平有限,在由音频转文字这个环节就很容易产生错误,而流利说积累了超过 3000 万录音数据库,基于这个数据库和深度学习技术,流利说开发出了一个能够听懂中国人说英语的语音识别引擎,在分析数据以后给出反馈,甚至能细化到时态问题上。
因为雅思口语考试需要和考官的交互,在实现了第一步语音识别之后,后续就需要自然语言理解和自然语言处理技术。在这方面,林晖介绍,即使用户在回答“考官”的问题时说跑题了,系统也能能识别出来,甚至给出词汇上的建议,比如建议用户把 Beautiful 替换成更高级的 Gorgeous。那么如果用户的表述过长(现在 Part 2 的最长时间在 2 min 左右),是否会影响机器的判断呢?林晖表示,雅思流利说严格按照雅思的评分标准来训练模型,输入的语音长短并不会影响机器判断,反而更能通过流利度、连贯度和逻辑性会给更多的评分信息。
在语音识别和测评技术上,科大讯飞和驰声科技都曾有自己的壁垒技术,针对课改后的考试情况,驰声科技今年还升级了自己的语音测评技术,能够通过整体评价、定位错误、诊断错误三个环节多维度评测发音能力、语用能力及表达能力。在这方面,林晖表示其它产品都希望利用机器来取缔考官的评分,而雅思流利说的差异化在于技术升级,而且利用升级的技术为用户服务,给用户提供精细的反馈。
其实,除了雅思考试,托福和最近正在兴起的 PTE 考试都采用了机考,为什么不从更加标准化的考试入手呢?翁翔坚表示,流利说的产品策略,就是想先解决最难的东西,然后以小代价快速扩展到其它口语考试上,而且雅思考生的模拟和测试需求更集中。林晖补充认为,对机器学习型的产品来说,不同测评的底层技术都是一样的,不同之处只在于评分标准,只要设定了这个标准,收集了数据就能实现。
目前雅思流利说内有上千套模拟题目,用户可以无限次免费练习,但是获得报告需要付费,付费分为涵盖 1 份报告的 49 元版和 5 份报告的 199 元版,iOS 和 Android 版本都已经上线,翁翔坚表示,雅思流利说还处于冷启动阶段,主要靠口碑和考生小范围内推广,他同时透露:“在推出雅思产品之后,流利说还会有一系列动作,会协同一些伙伴发出声音。”