本月北京听力协会表示,中国残疾性听力障碍人士或达7200万,而目前国内助听器选配比例仅5%,远低于国外的24%。听障群体在残疾人中占比较高,但他们的需求一直没有得到很好的重视。如何解决日常沟通也往往成了听障群体面对的最大问题。
从需求出发,目前国外几家公司分别推出了面向听障人士的语音识别交流类产品,其中包括36氪之前报道过意大利的Pedius、法国的Roger Voice以及美国的Ava。
在国内,音书科技也在做这样的事情。成立于2016年7月,音书科技主要从事听障交流app和AR眼镜开发。团队创始人石城川本身就是听障人士,暨南大学毕业后任跨国公司工程师,后辞职与华南理工大学校友陈国强和彭驷庆合作创办了音书科技。
主打产品音书App于今年年初上线。作为一款听障人士交流辅助软件,音书App主要有三大功能:实时字幕功能,将接收到的语音转化成文字,用户可以此来进行现场沟通以及“听”新闻等内容;电话功能,用户可以在非苹果设备上接听电话时打开音书App即可完成语音和文字的转换,让听障人士也能“打电话”;另外,音书还提供了语音训练版块,帮助听障人士进行语音训练,闯关模式也增强了用户的参与度和趣味性。
目前产品覆盖普通话、英语、四川话、粤语和河南话等。准确度方面,可以在声源和手机距离20厘米、日常噪音环境以及口语标准的情况下达95%。反应速度方面,可以达到网络顺畅的情况下延迟小于500ms。目前主要技术难点是远场语音的增强和降噪,团队也正在研发基于卷积神经网络的语音降噪算法(cnn)。创始人石城川表示,目前音书已经有三项专利和二项软著获得授权。语音识别使用的是讯飞开放平台引擎。
石城川表示,App目前有近3万用户,其中99%是听障人士,日活10%左右。用户对产品的兴趣度较高,对听障人士来说难度较高的语音训练“百文灭”,平均每天至少要读对一篇文章,但仍有用户玩到了“军长”级别。团队也不断针对用户反馈建议进行产品迭代,据悉还曾收到用户感谢电话。
推广方面,团队目前主要侧重线上推广,通过微信、微博、QQ群等社交平台以及公众号、头条号、搜狐号等自媒体平台两个渠道进行,官网也在几个月前上线;同时音书科技也将与相关公益机构合作进行推广,目前已得到中国和广东省聋协的支持鼓励,接下来也将和他们合作进行一些线下推广的尝试。
除APP之外,团队还从2016年4月开始AR眼镜的研发。主要原理是语音识别和手语识别:一方面将手语动作转化为语音信息,并通过扬声器播放;另一方面将语音信息转化为文字信息,通过显示屏显示。听障人士佩戴该智能眼镜就可以实现与正常人的交流。目前已经完成了二代原型机的研发,并获专利授权。初步计划在年底推出。
技术研发方面,音书科技与华南理工大学机器学习实验室从事手势识别研究的教授团队合作。数据采集方面与上海“随手执梦”团队等相关的团队接触合作。因为深度学习需要大量数据,石城川表示,AR眼镜的研发技术难点是全国不同类型的手语数据采集,目前国家正在力推手语统一的工作,在一定的程度减轻了团队工作量。
除此之外,音书科技的长期目标是搭建一个供听障人士交流以及面向不同种类用户需求有针对性地帮他们提升沟通效率的平台。团队透露,目前也正在开发更加实用的功能,新版本也很快会上线。
公司去年底至今年初获得来自个人投资者的数十万资金,目前主要用于产品研发,另外涉及团队建设、品牌建设和产品推广。目前正在寻求天使轮融资。
盈利模式方面,石城川表示,AR眼镜早期主要以面向种子用户的试用为主,在此基础上进行产品迭代,之后产品成熟后推向市场进行销售。App方面,不同于国外同类软件的按时等收费模式,音书App现有的功能是免费面向用户的,接下来会对即将推出的功能进行收费尝试;此外,后期平台成熟后有相关助听器、人工耳蜗等厂家等入驻平台进行线上电商运营。
团队方面,除创始成员石城川、陈国强以及彭驷庆之外,另外还有两名软件工程师以及来自广东地区高校的15位实习生。
就听障辅助交流App来说,国内市场类似产品还有心声、声活等。从功能上来看,它们都不具有语音训练功能,而多了类似朋友圈的动态发布功能,但会存在有些用户会在里面发广告等问题。其中声活更像一款听障人士社交软件,具有加好友、手语表情、新闻推送以及翻译预约等功能。单就打电话来看,音书可以实现电话接通后打开App即可实时翻译,而心声则需通过传输线连接两部手机进行翻译。