此前 36氪曾报道过,海云数据是一家大数据公司,其将服务聚焦在数据可视化和可视分析上,目的是帮助客户增加收益,减少成本。目前海云数据有“智驾”和“图易”这两款核心产品,帮助大企业部署具有行业属性的大数据分析和决策能力,将大数据落地到具体的应用场景中。当前海云数据的解决方案已经涵盖了航空、军事、安全、金融、能源、政府和医疗多个领域。
今日,海云数据在“亚洲大数据可视化分析峰会”上,发布了与重庆市公安科研所共同研发的唇语识别科研成果,能够对没有声音的视频里面的人物唇形进行识别并解读成文字,开创了中文唇语识别模型的研究先河。
唇语识别技术并不神秘,国外就已经有所研究。据国外媒体报道,牛津大学人工智能实验室联合Google的DeepMind团队和其他研究员联合发布唇语读程序LipNet,在GRID语料库上LipNet的准确高达93.4%。而Google自己研发的唇语识别技术通过5000万小时的BBC节目的训练识别准确度也有很大提高。
这种“读唇术”难就难在机器需要观察唇形变化并将其这些细微的变化与具体的发音对号入座。据海云数据CEO冯一村介绍,通过对视频中的人物的嘴巴上部署大量识别位点,海云数据能够判断这些人的嘴型从而判断出他们所表达的关键内容。而对于说话者的嘴型识别,经过1万小时各地新闻联播的训练,海云数据已经形成一套相对完善的AI模型。虽然这项技术离投入实战还有一些距离,但是其在中文准确度已经能够达到71%,英文准确度达到80%。
未来,这项唇语识别技术将会应用在公共安全、军事情报、身份识别和残疾教育这四个领域。
关于产品化,冯一村表示这是海云数据接下来在唇语领域即将展开的阶段,在实现产品化之后,未来海云数据还会将这项技术落地到具体的应用场景中。
据悉,目前海云数据的团队在300人左右。2016年年初,海云数据完成了1亿元人民币的A轮融资,投资方为上古资本和东方富海。
『本文图片来自:Yestone 邑石网正版图库』