智能语音交互正成为新的趋势,音频器件产业链迎来新春天。市研机构Yole Développement的数据显示,整体音频器件市场规模已超150亿美元,有机会于2022年增至200亿美元。远场噪音环境下的语音识别、多人语音识别等制约智能语音交互的难题急需解决。声学公司纷纷推出新一代的音频解决方案,不少AI公司也试图通过语音识别的软件算法优化解决这些问题。
我们近期接触的初创公司GMEMS( 通用微科技)从声学原理入手,从算法、芯片、MEMS麦克风切入,打通芯片到模组的全产业链,解决这一难题。
GMEMS成立于2016年下半年,将声学微型传感器研发与智能算法及软件相结合,经过一年左右时间,已经完成了声学相关算法及软件、MEMS麦克风芯片的研发,产品已在小米手机、PC、蓝牙耳机等领域商用落地。
团队目前研发的三款MEMS麦克风芯片分别为低端62DB、 中端65DB、高端 68DB规格。其中中端65DB规格已经进入批量生产。高端 68DB(同平台实测约为66到67DB)、低端62DB规格将于本月推出,今年量产。CEO告诉36氪,目前该产品线产品水平已经达到与音频器件大厂楼氏、英飞凌同一水平,是目前国内可以实现的最好水平。
在智能语音交互日渐流行的当下,GMEMS的声学前端产品卖点之一就是解决噪音环境下远场识别的鲁棒性问题、多人语音识别的鸡尾酒会难题。在降噪方面,团队过去长期从事相关算法的研究,降噪相关的算法已经相对成熟,也被小米MAX2手机采用。为了解决鸡尾酒会难题,产品集成了声纹识别的功能,可以监测出不同的人声并加以区分。团队表示,用户仅需要训练两分钟,到实际使用时就可以只摘取某一特定用户的声音。
声学前端器件的研发并不容易。团队之所以能在一年之内完成研发,与团队的专业背景密不可分。公司目前技术团队25人,核心团队多数为美籍,其中博士学历4人,硕士学历8人,从2003年开始就在基于MEMS的声学微型传感器方面进行研发,所研发的产品最终被各大品牌笔记本电脑(如联想、戴尔等)和手机(如小米、联想、魅族、索尼等)使用,此前也曾在该领域多次创业。
不过,团队并不满足于现有的技术水平,一直也在研发更高性能的产品,采用了与目前电容式硅麦、压电式麦克风完全不一样的工作方式和原理,可以在器件尺寸不变的情况下做到76-80DB(目前行业最好水平是68DB),若今年开始流片,有望在一年后正式推出工程样品。目前已申请三个专利,预计还会申请多个专利组建专利池。
相比于大多数声学前端器件厂商只从事产业链的某一环节,GMEMS则采用了全产业链的商业模式,从算法切入,涉足芯片、传感器、麦克风阵列等环节,提供一整套智能语音入口的声学硬件解决方案。
之所以选择这样的商业模式,主要还因为半导体行业上游公司往往议价权较弱,越往产业上游公司能分到的产业蛋糕就越少。在声学前端器件产业上游,从晶圆厂商及芯片厂商,到MEMS麦克风厂商及IC厂商,再到麦克风阵列厂商,所能获得的收入及利润往往是递增的。
作为关键环节的MEMS麦克风,现阶段虽然销量几十亿颗,但市场规模也仅在10亿美元左右,向MEMS麦克风传感器的下游环节切入,很可能是GMEMS的必选之路。这种发展路径在音频器件领域也已被大厂证明。
当智能语音交互的重要性日益提升,声学前端器件大厂也都纷纷推出自己的麦克风阵列产品。GMEMS主打的卖点之一就是结合AI技术,让麦克风阵列更为智能。以往麦克风阵列的尺寸、摆放位置都非常规定,需要进行多维度的匹配,这使得优质的麦克风阵列的尺寸普遍较大。团队在此前与手机厂商合作的过程中就发现了这一痛点,利用机器学习的技术,让机器自行调整,厂商不管是使用几个麦克风,都可以最终达到优秀的效果。
对物联网发展的乐观预期,是这一波音频器件繁荣的主要推动力量。为了使得麦克风阵列产品能够更好的适用于联网设备,团队也在努力使得产品能够兼顾高性能与小尺寸,利用软件算法方面的优化,使用4个麦克风就能达到七、八个左右麦克风阵列的效果。
不过,与市面上目前不少初创公司看重智能音响市场不同,GMEMS则首先选择了有语音交互现实需求的电视机顶盒及耳机市场,并已经有想关的合作伙伴及意向合作伙伴。
在美国生活多年的王云龙认为中、美国情不同,中国人居住房屋情况与美国不同,且没有美国人非工作时间之外的生活文化,中国版的Echo很可能不是智能音响,而更可能是耳机。数据显示,不考虑随手机附带的耳机,2015 年全球耳机市场出货量已经达到3.5亿,市场规模已达 100 亿美元,无线化、智能化又是耳机行业的大趋势 ,端侧识别则是耳机智能化的趋势之一。
电视机顶盒则是一个暂时还未被重视的市场。数据显示,中国有 4.3 亿户家庭,电视机保有量约 5.35 亿,截止 2015 年底电视机顶盒的保有量在6000万左右,也有智能化迭代升级的需求,增加语音交互功能也是不少厂商的需求之一。现阶段,市面上的音频器件产品在噪声环境下普遍只能做1-2米范围内的识别,GMEMS的产品则将识别范围拓展到了5-10米。目前,GMEMS已经为该领域的意向客户做了Demo演示,并收到不少合作意向。
智能家居市场是GMEMS 未来看重的一个大市场。数据显示,2014年全球智能家居市场规模达410亿美元,每年约有80亿美元的增速,中国智能家居市场规模在46亿美元左右,未来增速可达50%左右。而现阶段通过手机交互对用户并不友好,而市面上又没有太多成熟的智能语音交互可供选择。GMEMS认为,当公司的语音前端做到高品质且小型化、智能化时,会非常有优势。
目前,GMEMS在软件降噪算法及MEMS麦克风产品线上已经实现商业落地。软件算法方面,除小米MAX2外,今年可能还会有2家手机客户;台湾一家安防摄像头公司也已经植入了GMEMS的算法。MEMS麦克风产品线方面,已经实现大批量供货。目前,公司硬件销售在营收中占比高于软件,预计今年的订单量可以达到七八千万元,在明年机顶盒领域出货后,收入可能会有大幅提升。
GMEMS团队目前约有员工近一百人,核心的软、硬件团队位于硅谷。CEO 王云龙博士毕业于美国密西西比大学物理声学专业,历任KLA-Tencor(全球最大半导体晶圆检测设备制造商)高级工程经理、美国富迪科技公司副总裁、美国通用微机电系统有限公司(General MEMS Corporation)创办人兼总裁,发明了三十多项MEMS传感器方面的专利,涉及消费电子、生物医学、免疫检测等方面。CTO 吴广华博士毕业于美国加州大学伯克利分校机械工程(博士),师从著名的MEMS领域知名教授 Arun Majumdar,共发表各类专业论文(期刊和会议)余30篇,中外专利及申请近30项,曾在世界著名的通用电气公司(GE)担任MEMS新产品开发经理,负责MEMS设计、开发、制造和与ASIC的集成。
因为涉及到大量专业知识,声学前端器件技术研发门槛高,不过在外界的印象里与终端的影音硬件相比一直是个“不赚钱”的行业。但相比于其他行业,这个普遍To B的行业主要依赖于技术实现能力,而非渠道、品牌,因此每一次新的硬件终端机会出现时,都会给予技术型初创公司提供发展契机。比如,智能手机问世,尤其是智能语音手机助手推出以来,MEMS麦克风产品迎来新的机遇,歌尔声学即是抓住了iPhone的大订单,获得了商业上的大发展。
相比于智能手机,物联网很可能会是一个更大的市场。调研机构预测,2020年联网设备将达340亿台(激进数据预测或达460亿台),产值也有望增长到500亿美元。对于音频器件厂商来说,这或许又是一个新的洗牌窗口期。