如果你实在闲的蛋疼,不妨拿起你的iPhone用标准的四川话对Siri说,“放心巴适得很绝对正宗 ”,当然来自美帝国的Siri是不可能听明白四川话的(但她可以听懂粤语......)。事实上不仅是Siri,市面上的语音助手类产品,几乎没有听得懂四川话的。不过这一现象将很快得到改善,科大讯飞率先发布了四川话语音识别技术。
国内目前做方言识别技术的公司不多,其中最大困难就在于国内的方言实在是太多了,需要建立不同的识别模型。而且各个方言缺乏足够多的语料,训练不足,导致识别准确性不高。所以优先只能够解决使用人数比较多,或者是范围比较广的方言,例如很多语音类产品都可以识别粤语。
科大讯飞的解决办法是,主要是通过深度神经网络等技术,做出一个方言语音识别引擎,用于方言口音适配。同时跟国家语委合作,征集到了足够多的方言语音数据来训练识别引擎,通过大量的预料训练,提升方言识别的准确性。据科大讯飞宣称,他们的四川话语音识别引擎,识别准确率超过85%。
据科大讯飞向36氪透露,四川话语音识别技术将率先应用于输入法产品,很快将发布支持四川话语音输入的讯飞输入法将。此前讯飞输入法已经支持普通话、英语、粤语语音输入。除了手机输入外,方言音识别技术还是有比较丰富的使用场景,例如语音驾驶导航、智能电视、可穿戴设备都用得上;甚至还可以成为教育教学、考试考评的公众平台;另外,在聆听京剧、川剧、昆曲、黄梅戏等戏曲时,提供普通话意思“翻译”......
虽然不像普通话这么有普世意义,但四川话总是有非常独特的魅力。而且据不完全统计,在全球大约有1亿2千万人说四川话,是一个非常庞大的群体。而且随着智能语音技术的普及,非要让四川的同学说普通话才能够享受到,这是非常不科学的......所以干脆研发四川话语音识别技术来得比较实在。
除了四川话,科大讯飞正在研发的东北话、上海话等方言语音识别技术也将在年内陆续发布。
演示视频