近日实地集团技术工程院算法组参加了由昆山杜克大学、联想研究院和北京邮电大学在中文口语语言处理国际会议(ISCSLP 2021)上发起的个性化唤醒语音挑战赛。来自北京大学、厦门大学、小米、出门问问、Pachira普强、杭州国芯和实地集团等的几十支在智能语音赛道实践的团队参加了比赛,最终实地集团获得第三名。
本次赛事中,个性化语音唤醒考察的是带有声纹认证功能的语音唤醒技术,包括近场单通道语音个性化唤醒及远场多通道个性化语音唤醒。远场多通道个性化语音唤醒任务,其声纹注册数据是近讲数据,而测试数据是远场设备采集的多通道语音数据,体现了实际应用场景中跨信道、复杂声学环境等因素的影响,是智能家居、会议场景所面临的典型问题。
带有身份认证的语音唤醒技术是语音技术发展的重要领域之一,也是智能物联网安全发展的重要驱动力。随着社会不断发展,人们的生活水平不断提高,人们对人身安全和财产的重视程度也越来越高。越来越多的社区,都安装了安防监控设备,如:红外探测器,湿度报警,门禁,烟感,监控等报警设备。然而这些系统往往各自独立而且是通过电话线上传报警信息,经常发生误报,漏报等事情。在很多情况下,即使发生了入侵报警,也因为与警方联动不及时,造成犯罪嫌疑人发生犯罪后逃离,事后办案难的后果。
多年来,实地集团持续深耕社区智能安防领域,并研发了一款基于AI 系统的智能音频报警设备,也是国内首款专门针对户外场景(偏僻道路,地铁,校园公园等)、采用音频AI技术进行安全报警和预警的设备。这款语音识别器使用最新的语音AI 深度学习技术,创造性使用端到端全卷积神经网络语音识别方案,通过神经网络识别出语音的关键字并且前端也使用了语音预处理算法模型来提高语音识别率。基于多AI识别算法联合复核,结合动态环境自适应算法,识别准确度高,确保产品在各类应用场景下性能如一;灵活的定制化扩展能力,可快速支持客户定制唤醒词及特征性声音的识别,具备及时性,准确性,高鲁棒性的特点,能够时时刻刻保护社会安全和人身安全。
这款设备可为驱散校园霸凌、守护校园安全做出贡献。通过AI音频识别,该设备可全天候监控异常声音,自动报警及声光驱离,重点勘察校园视频监控“死角”,在校园暴力事件发生中及时干扰、阻止。预警危险事件,保障师生安全,提升学校安全防范能力,让校园不再有暴力死角。截止2020年底,实地智能音频报警系统已在山东、江苏、四川、陕西、湖北、内蒙、辽宁等地的校园场景实现落地应用。
未来,实地集团将持续在语音识别算法、视觉语音算法和其他计算机视觉技术上做更多深入研究,积极推动前沿技术应用于实际场景,打造更智慧、更宜居、更以人为中心的智慧社区。