编者按:本文来自微信公众号“智东西”(ID:zhidxcom),作者:韦世玮,编辑:漠影 ,36氪经授权发布。
一晃眼,苹果当下最新款TWS耳机——AirPods Pro已推出两年多了。
短短两年里,苹果TWS耳机的全球市场份额已从2019年的大半壁江山,下滑到2020年Q3的29%。
与此同时,从2019年至2020年,三星、华为、小米等玩家密集推出多款TWS耳机,宣发密度一浪盖过一浪,各类玩法集成炫技。
但TWS耳机市场却仍是苹果的天下。苹果凭什么?
不可否认,苹果AirPods Pro的主动降噪、通透模式、自动均衡三项技术,不仅是引爆TWS耳机的关键,同时也为这一品类的市场发展开辟了一条新赛道。
据Canalys最新预测,到2024年,全球TWS耳机出货量将从2020年的超2.5亿副增长至5亿副以上,2020年至2024年的年复合增长率达19.8%。
在这庞大的市场背后,谁都不想让苹果成为唯一的赢家。如何加速超车从苹果手中抢下更多的蛋糕,也是每一个玩家入局市场的目标与野心。
而在这野心背后,玩家们又在摩拳擦掌准备如何追赶苹果?他们如今正在研发和创新的技术、给耳机带来的功能变化,是否又能成为下一代创新的技术趋势?
透过当下TWS耳机市场百花齐放的阶段,智东西也看到了玩家们正在努力改变TWS耳机市场的5大技术趋势,从关键零部件设计到封装技术,再到性能的优化及创新,我们尝试通过拆解这些技术,发掘其对市场发展带来的多种可能性。
对许多耳机发烧友们来说,“听个响”的TWS耳机远不足以满足自己对音质的要求,抛开信息传输损耗的硬伤外,决定耳机音质优劣和风格的关键是耳机中的发声单元。
从传统音频产品上来说,耳机发声单元包括动圈、动铁、圈铁和静电等。其中,动圈单元技术的成熟度最高,它主要由线圈、振膜和磁体等构成,具有低频好、声场宽的优点。
尽管动铁技术的兴起较晚,其发声过程与动圈类似,都是靠线圈在永磁场中的震动来发声,但动铁在构造原理、位置、声音与动圈有着较大区别,或者说在一定程度上“互补”。
例如,虽然动圈低频好、声场宽,但动圈的高频解析不如动铁,动铁的灵敏度和解析力比动圈更出色。因此,动铁最初多用作助听器、监听耳机上的发声单元。
那么动圈和动铁两者优势就不能集成在一块吗?当然可以。
市场中有另一种名为“圈铁”的发声单元技术,已逐渐成为各大HIFI厂商们青睐的解决方案。顾名思义,“圈铁”由动圈+动铁组成,兼得良好的高低音频解析,也拥有不错的灵敏度。
国内声学技术及语音交互创企声加科技创始人兼CEO邱锋海告诉智东西,由于目前大部分TWS耳机都追求音质的低频效果,加之ANC(主动降噪)对换能器有低频响应的需求,因此市场上多数TWS耳机都采用动圈、圈铁或一个动圈+多个动铁的发声单元解决方案。例如,在一个动圈+一或多动铁的方案中,各发声单元负责不同的频段。
还有一些较为偏门的解决方案,例如部分头戴式耳机会采用多个动圈单元,并放在不同的位置来模拟多通道输入,或制造环绕声等空间听觉的效果,“不少游戏耳机就采用这样的设计”。
现阶段,包括亚马逊、三星、万魔等在内的少数玩家,已开始尝试集成双扬声器单元的方案来提升TWS耳机的音质效果。
例如,亚马逊首款TWS耳机Echo buds就采用了楼氏电子的双动铁扬声器单元,三星今年1月推出的Gaxlaxy Buds Pro采用了双动圈扬声器单元,万魔则是圈铁主动降噪解决方案(动铁单元+10mm动圈单元)。
总的来看,目前TWS耳机市场中采用纯动铁单元的方案还较少。但在邱锋海看来,如果TWS耳机逐步朝着小型化的趋势发展,那么采用纯动铁的解决方案是有必要的。
一方面,动铁不用设计后腔,同时其低频正在慢慢改善,价格也在下降,未来在市场中会有一席之地;另一方面,如果厂商对playback(回放)品质有要求,圈铁也是个不错的选择,动圈单元在保持低频响应下,直径正逐步做小,但这对工艺要求也较高。
如果说对音质高保真的追求是耳机诞生的初心,那么TWS耳机的发展,迟早有一天也要回归对音质水平的重视。
在这一条件下,通过动圈动铁结合的多扬声器单元方案来提高耳机高低频解析的性能,也将是TWS耳机技术发展的一大趋势。
空间音频也叫环绕音频,简单来说就是能让人对空间声源位置产生全空间立体感知,我们常常在电影院或家庭影院中感受到被声场包围、气势恢宏的效果就是空间音频。
苹果在2019年发布的AirPods Pro,以及2020年发布的AirPods Max就采用了空间音频技术。这对于耳机——尤其是TWS耳机来说,无疑是空间音频技术的一大突破。
实际上,空间音频技术已经发展多年,但它在耳机上的应用较少。
主要在于面向大空间环境的音响设备(音源)是固定的,随着用户所处的位置发生变化,其得到的环绕声也有不同。这一场景下,空间音频技术需要解决的主要是耳廓外的空间问题。
而TWS耳机是直接将音频输入耳中,同时每个人耳廓内的空间结构远比耳廓外的空间要复杂,因此耳机的空间音频不仅要还原出不同位置声音从前后各方位到达用户耳朵的时间差,还要考虑人体结构对声音造成的影响。
这就涉及到HRTF(Head-Related Transfer Function,头相关传递函数)。什么是HRTF?某视频平台up主“大宽物理”在其科普视频中提到:
“由于人体生理结构的关系,声波会在头部、耳廓、耳道等地方发生各种绕射和反射,互相干扰并加强或减弱某些频率,所以就算音响的频响曲线(Frequency Response,量化音箱音染大小的函数曲线)是平直的,其声音经过耳朵后,人类通过听觉系统感受到的频响曲线也不是平直的。工程师则将人类听觉的这一特性用函数来表示,也就是HRTF。”
因此,耳机的频响曲线需要做到不平直的,才能让人感觉到精确平衡的声音。目前行业中的音特美曲线、哈曼曲线等,都是不同玩家根据人体听觉特性来制定的,但这些曲线也仍存在不足。
“大宽物理”提到,就算把耳机的频响曲线做成理论上的目标曲线,也不一定能准确还原声音,因为每个人的头、耳廓和耳道等生理结构不同,导致每个人的HTRF也不同,甚至头戴式耳机每次佩戴方式的细微差别都会造成影响。
想要解决这一问题,就需要准确测量出每个人的HTRF。但行业中传统测量HTRF的方式不仅成本高,也无法解决头戴式耳机佩戴方式不同造成的差异,更别说面向大众市场。
索尼在2019年曾展示了名为360 Reality Audio的空间音频技术,但该技术是基于“平均HRTF”来优化环绕声效果,并不支持测量用户自身的HRTF和头部追踪。
那么,苹果的AirPods Pro和AirPods Max是如何准确测量出HTRF,实现空间音频技术的?这主要涉及两个方面——传感器/芯片、算法。
1、传感器/芯片:一面追踪搜集数据,一面提供算力
硬件方面,AirPods Pro和AirPods Max都内置了传感器和陀螺仪,对用户的头部进行追踪,同时还能实时追踪比对头部和设备间的运动数据,以更好地实现顺滑的环绕立体声。
在耳机发声单元前方,苹果还放置了一个麦克风,能够一边“听”用户正在听的音乐,一边收集音乐从用户耳道内反射出来的声音,以此探测用户耳机的佩戴情况。
同时,苹果自研H1芯片能够以每秒200次的速率,根据用户耳机佩戴情况的变化对声音进行实时矫正。据称,一颗H1芯片的算力相当于一个iPhone 4手机。
这就意味着,不管用户在做什么导致耳机佩戴情况变化,耳机都能随时为用户将声音调整到最“准确”的状态。
2、算法:为用户定制专属HRTF函数模型
传感器和陀螺仪负责收集数据,H1芯片负责为数据处理提供算力,那么耳机内部的算法是如何运行的呢?
实际上,苹果在2018年9月申请了一项名为《用于双耳声音再现的与头部相关的传递函数选择(Head related transfer function selection for binaural sound reproduction)》的专利。
该专利提到,苹果在耳机中内置了一个HRTF库,涵盖大量不同的HRTF模型。当用户在使用耳机时,计算音频(Computational Audio)算法会通过机器学习技术,将麦克风搜集到用户耳道内的声学特征与HRTF库中的模型做对比,并挑选出一个最适合用户的HRTF模型。
接下来,算法会基于用户特征对挑选出来的模型进行优化,最终得到属于用户的HRTF函数,这一方法大大减少了直接测量HRTF函数会带来的巨大算力要求。
此外“大宽物理”猜测,苹果通过算法模拟出的多声道空间,可能也是利用从用户身上测量到的专属HRTF函数,来对算法进行优化的。
不过,AirPods Max的空间音频效果要优于AirPods Pro,主要原因在于头戴式的Max能够同时测量耳廓和耳道的HRTF,数据更为精确,而Pro只能测量耳道内的HRTF函数。
同时,目前苹果的HRTF测量仍存在一定的局限性。那就是这项技术还只能测量耳道和耳廓数据,无法测量肩膀、头部等其他部位的HRTF数据,使得算法模拟出来的空间音频效果不够完善。
不过可以肯定的是,从传感器到芯片再到算法,苹果这环环相扣的空间音频技术技术不仅能为用户“量身定制”独有的音频环绕体验,也为TWS耳机的技术创新与发展提供了一个行之有效的道路。
降噪是目前TWS耳机玩家们猛烈进攻想拿下的技术高地,通话降噪是其中的一个重要赛道。
简单来说,不管用户在何种场景下,通话降噪技术都能让用户电话一头的人也能听清讲话内容,而不是各种嘈杂的噪音。
从技术方面看,通话降噪的三大核心技术包括Beamforming指向增强技术、自适应滤波技术、上行骨传导技术。
基于这三大技术,各家厂商结合各自的算法和芯片等优势,为推出各类通话降噪解决方案“大打出手”。
目前,市场中主流的通话降噪方案包括单麦克风、双麦克风阵列,以及依靠加速度传感器和耳内麦克风等器件来辅助实现的通话降噪方案。
此外,2020年也有越来越多的玩家推出了搭载三麦克风通话降噪解决方案的TWS耳机,包括三星Galaxy Buds Pro、华为Freebuds Pro、小米Air2 Pro和OPPO Echo X等,而这都是这些玩家目前最新款的TWS耳机产品。
不难发现,目前市场中的TWS耳机通话降噪方案正逐渐朝着多麦克风降噪的方向发展。
其中,三星Galaxy Buds Pro的通话降噪在内部硬件结构、软件、外部设计均进行了优化。内部搭载了一个拾音传感器(voice pickup sensor),以及三个麦克风(三麦克风通话+VPU语音拾音器)。
只要拾音传感器监测到声音,面向耳机嘴部的两个外部麦克风就进行波束成形,以抵消外部噪声。第三个麦克风仅关注用户的声音,这能在大幅度地降低外界噪音并放大用户声音。
而在外形设计方面,三星直接将耳机设计为贴合人耳内部的“豌豆”形状,减少直接与风接触的面积,还有耳机上的外网与内风室来共同分散并削减风的影响。同时,三星还内置了高级软件来区分人声和风声,以确保就算有风接触,风声也不会进入麦克风。
国内玩家如华为,其Freebuds Pro耳机采用三麦克风系统+骨声纹通话降噪技术。其中,三麦克风系统的通话降噪工作方式与三星Galaxy Buds Pro大致相同,而骨声纹通话降噪技术能够感应用户头部震动,只拾取用户人声并进行增强。
不过,由于骨声纹通话降噪技术的成本较高,目前只有苹果、三星和华为等玩家的部分高端TWS耳机上应用较多。
而小米、OPPO、荣耀和万魔推出的TWS耳机所采用的三麦克风通话降噪方案,均来自声加科技。硬件结构方面,该三麦克通话降噪方案均内置反馈麦克风、前馈麦克风、通话麦克风,以更精准地拾取人声。
▲小米Air 2 Pro耳机搭载的声加科技三麦克风通话降噪算法
算法方面,邱锋海告诉智东西,该方案最主要的特点是将以往用在入耳式ANC耳机中进行主动降噪的单颗麦克风,用来进行通话降噪,能大大提升用户在大风噪(如骑车)和大噪声(如地铁)下的通话降噪体验。
不过,在多麦克风通话降噪技术领域,麦克风是越多就越好吗?答案为不完全是。
“麦克风器件增加的边际效用是递减的。”邱锋海解释道,器件的增加不仅需要更多的体积空间来放置,其整体效果也依赖耳机的物理结构设计,如果器件多了也会增加生产制造一致性的要求,造成良率下降,“所以还是要综合考虑”。
同样是降噪,但智能主动降噪与通话降噪不同。
我们可以简单理解为,通话降噪是让用户传输到电话另一头的声音更加清晰真实,弱化外部环境噪音的干扰,让电话另一头的人听得更爽;而主动降噪则是让用户自己听到的声音更加干净,降低不同场景中噪音的干扰,让自己听得更爽。
尽管苹果AirPods Pro点燃了TWS耳机主动降噪技术的热潮,但在之后的一年多时间里,主动降噪技术在各个玩家里都被玩出了百花齐放的态势。
尤其是“智能主动降噪”的方案出现得越来越多,包括三星、索尼、BOSE、华为等玩家推出的TWS耳机产品都具有这类功能。
从技术方面看,ANC降噪的原理是通过麦克风采集环境中的噪音信号,同时内部产生一个反相的声波来抵消噪音信号。这不仅需要麦克风负责噪音采集,还需要处理器来预测噪音出现的情况。
那么,“智能主动降噪”的“智能”是怎么实现的?
据了解,为了保证前期抵消噪音信号的降噪质量,厂商还会在耳机中添加一个反馈麦克风来检测噪音是否变小了。同时,处理器还会根据反馈麦克风测量到的结果,对处理过程进行适当的调整优化,以达到最佳的降噪效果。
就类似于,学生在解完一道题后,还会反复检查这道题的解法是否有问题或有更好的解法,并不断提升自己的“解题”能力。而这,就是智能(自适应)主动降噪的过程。
但具体对比下来,三星、索尼、BOSE和华为等玩家的智能主动降噪方案也有不同玩法。
例如,三星Galaxy Buds Pro的智能ANC,则通过麦克风和传感器的搭配,前者负责检测用户声音、后者检测用户嘴巴的震动,同时内置的AI算法会学习区分用户声音和其他人说话声。当耳机检测到用户开始与他人交谈时,就会自动切换模式,让用户无需摘下耳机就能清晰与人交谈。
而索尼WF-1000XM3的智能降噪功能,可以通过手机APP开启“自适应声音控制”,不仅能自动检测用户的活动状态,还能自动为用户切换至预设的环境声和降噪方案。同时,它还提供了20级的环境声可控降噪,能定制多达20种环境声级别。
整体来看,智能主动降噪同样需要到前后反馈传感器、芯片和算法之间的相互配合。其中,芯片又分为集成主动降噪功能的TWS主控蓝牙芯片,以及专用降噪芯片。
各品牌厂商旗舰机型给出这些方案的体验差异各有千秋,但风噪场景下的表现最易被感知,差别显著,所以ANC的核心重点仍集中在提升风噪场景下的降噪体验。
“目前风噪场景肯定是ANC的最大痛点,解决好后才能对其他场景做得更细致。”邱锋海谈到,降噪除了适应环境外,还需适应不同人的佩戴,才能取得比较一致性的效果。
实际上,不管是多发声单元的采用,还是各类降噪技术的发展,其背后的实现都离不开封装技术的加持。
其中,布局精巧的SiP(System in Package)封装工艺就是能提高TWS耳机性能、加速生产制造的关键。
与其他封装技术相比,SiP封装的优势在于能够在布局面积不变的前提下,实现更多芯片和模组有机集成,从而提供更加丰富的功能和强大性能。
对TWS耳机来说,SiP封装工艺的3D堆叠特性,能够让耳机内部结构的各个组件基于人耳形状布局,还可实现更多功能芯片和模组的有机结合,以及提升耳机舒适度、贴合度及稳定性。
▲SiP封装的几种结构和解决方案示意图
据歌尔声学的相关报告数据,SiP工艺的应用可以将部分TWS耳机的器件整体尺寸减小50%。
与此同时,邱锋海认为SiP工艺还能有效地保护IP。“在PCBA上,我们很容易看到里面用的是谁家的芯片、器件,但TWS耳机的核心组件采用SiP封装后,即使被破坏也很难看到所有细节。”他说。
不过,SiP封装工艺也存在诸多难点,不仅涉及更复杂的布线、走线设计,还要克服信号干扰、散热、续航力等问题,整体系统的设计难度大于传统的TWS耳机封装。
目前,歌尔声学已为苹果AirPods系列的SiP封装代工多年,此外日月光、环旭电子也有相关的SiP封装解决方案。但业内仅有苹果AirPods Pro和三星Galaxy Buds Pro等少数玩家采用SiP封装,普及度不高。
主要原因在于,TWS耳机仍处于玩家混战格局,每个玩家的设计都不相同,暂时并未出现一种能符合各家要求的SiP设计。这就意味着,每个玩家开发系统时都需要重新设计SiP堆叠。
但随着TWS耳机市场的不断发展,以及玩家在封装技术领域的不断探索,相信SiP封装技术也将成为未来高端TWS耳机产品,甚至是更多TWS耳机的标配。
为了在一片混战的TWS耳机市场中抢占高地,各赛道玩家前赴后继地布局市场,从硬件到软件展开了各种解决方案的创新和探索。
在这之中,我们也看到了多发声单元集成、空间音频、多麦克风通话降噪、智能主动降噪、SiP封装这五个关键技术,对TWS耳机市场发展趋势产生环环相扣的影响,为TWS耳机每一阶段的创新积累经验。
但也要知道,仅仅靠一项强劲的单点技术,或是漂亮的测试数据,并不意味着能打造出一个完美的TWS产品,只有提升综合性能和体验,才能为用户带来更好的TWS耳机体验。
现在的TWS耳机市场仍是一个持续混战和爆发的玩家格局,随着供应链中每一环节玩家研发的持续投入和创新,我们也期待这个行业能迎来百花齐放的春天。