编者按:本文来自微信公众号“九鼎投资”(ID:JD_Capital),作者孟伟、冯卓;36氪经授权发布。
核心观点——
行业概览
1、专用的人工智能芯片行业刚刚出现,正在进入产业爆发期,并且将长期保持快速增长。
人工智能是近三年来最受关注的核心基础技术,将深刻的改造各个传统行业。人工智能在图像识别、语音识别领域的应用自2017年来高速发展,是人工智能最热点的两项落地应用。专用的人工智能芯片是该应用的技术基础与核心,也将随之迎来高速发展。
2、人工智能算法公司已经转化为方案公司,大力推动商业化落地,将带动对应芯片行业的快速崛起。
谷歌、百度、阿里、腾讯等互联网巨头以及多家知名的风险投资基金疯狂涌入人工智能行业,大力推动了各初创算法(方案)公司在多个应用领域商业化落地。算法公司对有效需求进行筛选和培育后,落地成功的市场将实现高速乃至爆发性增长,为上游配套的芯片公司创造了明确而广阔的市场空间。图像(人脸)识别系统、智能音箱是近两年比较明确的人工智能技术的落地应用。
3、人工智能芯片涉及算法、芯片设计技术及对应用场景的综合把握,具有很高的行业壁垒。
人工智能芯片行业是人工智能和集成电路的交叉产业,具有双重壁垒。一是人工智能行业具有很高的算法、数据、应用场景壁垒,二是芯片设计行业具有较高的人才、技术、经验和资金的综合壁垒。近期多家算法公司及传统芯片设计公司都推出了AI芯片,形成了新的产业及投资热点。
投资机会
1、终端人工智能芯片短期将迎来多次爆发,云端通用人工智能芯片将保持长期稳定增长。
中短期内,近期蓬勃发展的“万物互联”+“万物智能”生态将催生巨量的终端人工智能芯片需求,覆盖智能监控、智能家居、物联网、自动驾驶等多个热点领域。每个热点领域的爆发,都将带来特定AI终端芯片的爆发式增长。
长期来看,拥有强大的云端训练和推理能力的通用人工智能芯片将随着应用的逐步落地而保持长期稳定的增长。由于云端芯片对性能的极致追求,将逐步成为芯片行业的技术制高点,并且由于其具有广泛的通用性,甚至有可能孕育出因特尔、英伟达级别的新的云端领域的芯片巨头。一般来说,终端芯片对成本、功耗等因素的要求更高,传统芯片设计公司更有优势;云端芯片对算法、性能的要求更高,算法公司更有优势。
2、语音识别是人工智能技术迄今为止最明确的落地应用之一,终端人工智能语音芯片将迎来高速增长。
多家算法公司大力推动语音识别技术的落地应用,形成了算法、终端应用方案一体化的产业格局,并逐步开始自研或与传统芯片设计公司合作推出研发芯片,形成了语音算法和芯片设计公司既互补又竞争的格局。传统芯片公司大规模进入该行业,推动了低成本、低功耗专用语音识别芯片的实现,将进一步积极推动各类语音应用的迅速发展。
人工智能芯片(简称AI芯片)是指含有专门处理人工智能应用中大量计算任务模块的芯片,属于集成电路和人工智能的交叉领域。自2016年以来,谷歌、百度、阿里、腾讯等互联网巨头以及多家知名的风险投资基金疯狂涌入人工智能行业,大力推动各初创算法(方案)公司在多个应用领域商业化落地。随着人工智能在视觉识别、语音识别等领域明确的商业化应用不断涌现,人工智能算法及方案芯片化、硬件化的趋势日益明显,具有深度学习算法加速功能的芯片需求快速提升。
人工智能领域的高速发展,取决于对前沿算法的研究、落地应用场景的积极探索及通过先进的芯片设计、制造技术来满足日益明确的商业需求三个关键因素。商汤科技、旷视科技、科大讯飞、思必驰、华为、寒武纪等多家中国公司对于前沿算法的研究已经走在全球前列,与美国齐头并进。中国对于落地应用的探索更是全球领先,已经出现包括人脸识别、智能安防、智能音箱、智能家居等多个落地的商业场景。
新一代的AI芯片创业公司结合应用特点,采用了合理的先进芯片设计、制造技术,与美国同类公司相比位于同一起跑线上。业界普遍认为,AI芯片之争是中美两国公司间的竞争,中国目前暂时落后。但由于在应用探索上更加积极,未来中国AI芯片有可能超越竞争对手,成为全球领军力量。
AI芯片按照应用场景可以分为云端芯片和终端芯片,按照功能可以分为训练芯片和推理芯片。云端指服务器端,终端指包括手机、电脑、监控摄像头、家电、消费电子等在内的电子终端产品。训练指通过大量的数据输入,运用增强学习等非监督学习方法,训练出一个复杂深度神经网络模型的过程,其对芯片运算和存储的综合性能要求很高。推理指利用训练好的模型,使用新的数据去得出各种结论、完成各种任务的过程,其对芯片的速度、能耗、安全和硬件成本要求较高。
按照以上两个维度,可以将AI芯片划分至四个象限。其中,终端/嵌入式设备以推断应用为主,训练的需求尚不是很明确,但是,未来的终端设备将逐步具备训练和学习的能力。
图1:AI芯片按照两个维度分类
资料来源:清华大学、北京未来芯片技术高精尖创新中心
自芯片诞生以来,人类对芯片设计、高纯度硅工艺、超高精密设备、物理化学工艺的不断探索,促进了芯片技术的快速发展,芯片的计算能力呈指数形式增长,推动了个人计算机和互联网时代的诞生和发展。
2006年,以深度学习算法为标志的新一代人工智能诞生,2016和2017年,基于深度学习技术、运行于TPU(ASIC)上的Google人工智能AlphaGo相继战胜人类围棋世界冠军李世石、柯洁,引发新一轮人工智能发展热潮,计算能力再次成为人工智能时代的核心驱动力。AI芯片则是计算能力提升的集中体现,成为人工智能“大脑”的基础。
2010年至今,不同功能和定位的芯片均开始被研发用于深度学习算法,初步形成了GPU、FPGA、ASIC等繁荣共生的AI芯片行业。
AI芯片的设计、制造流程与其他芯片类似,由设计、制造、封装测试等环节组成。AI芯片设计公司下游为应用方案公司,方案公司将其整体解决方案(包括运行于云端和终端的各类软硬件)最终用于具体应用场景。目前处于AI领域发展初期,中国的算法公司投入大量资金及精力探索落地应用,算法公司与应用方案公司实际上已经合为一体。具体来看:
在下游应用环节,算法及方案公司根据不同的应用场景,制定云端和终端的芯片布局方案。其中,云端为应用场景训练可靠的人工智能算法,并承担大部分复杂的推理任务,终端直接为应用场景输出结果。目前,人工智能在安防、金融、医疗和教育等领域均获得了快速落地并形成了可推广的案例。
在上游环节,不同的人工智能算法对AI芯片的加速功能提出了不同要求,需要AI芯片设计公司根据算法特点,设计具有特定加速功能的芯片。按照推理和训练划分来看,训练环节所需的运算包括前向计算和后向更新,推断环节则主要是前向计算。前向计算包括矩阵相乘、卷积和循环层运算等,后向更新主要是梯度运算。
所以,两个环节运算特点不尽相同。云端侧重训练,算法更加复杂和广泛,对芯片的通用性和综合性能要求更高;终端侧重推理,算法更加高效可靠,对芯片的专用性和效率要求更高。同时,由于芯片具有一旦设计完成基本不可更改的硬件属性,算法公司需要结合算法的发展现状在现有AI芯片技术条件下选择合适的芯片架构及软硬件功能划分。
综合来看,算法与AI芯片设计互相影响。作为AI芯片公司,需要充分了解和掌握算法规律,设计出符合发展需求的AI芯片;作为算法公司,需要在各类AI芯片,尤其是专用芯片的基础上,实现算法的演进。
图2:AI芯片产业链示意
资料来源:九鼎投资整理
AI芯片行业属于人工智能和集成电路的交叉产业,具有双重属性,行业壁垒较高。
首先,人工智能行业存在两道壁垒。第一道壁垒是算法,只有掌握深度学习算法并具备持续更新算法的能力,才算真正进入人工智能的大门。第二道壁垒是对应用场景的理解,只有将算法在具体应用场景中落地,形成数据加算法的闭环,才能通过数据反哺算法,形成超越竞争对手的优势。
其次,芯片设计行业存在技术、人才、经验和资金的综合壁垒。芯片设计产业链环节多,需要多方面、多层次、多梯度的人才及丰富的量产工程化经验。需要采用先进制程的AI芯片,流片费用高达几千万,产品研发周期长达1-2年,新公司的进入门槛很高。
目前,在训练环节,由于需要更高效地进行大规模并行计算,英伟达GPU占据垄断性地位,因特尔CPU+FPGA、谷歌TPU和寒武纪MLU等ASIC方案也在加速追赶。
在推理环节,不同的异构芯片或专用芯片算力表现处在发展变化的过程中。云端推理方面,Intel的CPU+FPGA架构具有强大能力,英伟达也通过Volta架构大大提升了其GPU的推理性能;终端推理方面,由于更接近最终应用,不同的细分市场算法差别较大,ASIC由于专用性强、效率高、功耗低,成为主流选择,FPGA则适合用于算法方案快速变化的终端领域。
综合来看,未来可能呈现如下产业格局:GPU应用于高端复杂算法、高性能计算和数据中心;ASIC在云端训练、推理及智能终端广泛应用;FPGA 应用于变化较快的行业应用和虚拟化云平台。
表1:四类人工智能芯片对比
资料来源:九鼎投资整理
1、GPU
GPU(Graphics Processing Unit)是一种进行图形运算工作的微处理器。随着通用计算技术发展,GPU的功能已经不再局限于图形处理,在浮点运算、并行计算等高性能计算方面开始有广泛的应用。目前支持金融工程学、气象及海洋建模、数据科学及分析、国防与情报、制造业(CAD制图及CED)、成像与计算机视觉、医学影像、电子设计自动化、计算化学等多个领域共150多种应用程序的加速。但由于其功耗较高,主要用于云端计算。
GPU是目前深度学习算法训练的首选芯片,在该领域拥有最高的市占率。其拥有完备的人工智能计算软件生态,越来越多的深度学习标准库支持基于GPU的深度学习加速。与CPU相比,GPU适用于密集型程序以及并行计算,而CPU擅长于逻辑运算和串行计算。
(1)英伟达(NVIDIA)
英伟达的GPU产品主要包括PC端处理器GeForce、移动处理器Tegra和深度学习芯片Tesla。其中Tesla的核心产品包括基于PASCAL架构和Volta架构的系列芯片。
目前英伟达的GPU产品主要应用于各类计算平台、数据中心加速和深度学习训练,应用领域包括医疗、汽车、智能家电、金融服务等。基于Tegra系列处理器,英伟达发布了DRIVE PX开放式人工智能车辆计算平台,可实现包括高速公路自动驾驶与高清制图在内的自动巡航功能,应用的特斯拉ModelS已经开始量产,百度、沃尔沃也跟英伟达达成了合作,他们都将生产搭载DRIVE PX的智能驾驶汽车。
英伟达2018年5月推出的Telsa V100浮点运算速度提高了1.5倍,深度学习训练速度提高了12倍,推理速度提高了6倍。
(2)ATI(被AMD收购)
ATI是与英伟达齐名的显卡制造商,2006年被AMD以54亿美元收购。2017年8月,AMD搭载深度学习功能的新一代GPU正式发布,在各项测试和应用中性能超过英伟达Pascal系列。2018年,AMD 公开展示了全球首款7纳米制程的GPU芯片原型。总体而言,AMD在产品生态和市场份额方面不如英伟达,但仍是全球仅次于英伟达的GPU厂商。
(3)景嘉微
景嘉微是国内唯一拥有自主知识产权和成熟产品的图形处理芯片公司。公司创建于2006年4月,2016年3月在深圳证券交易所挂牌上市,现有员工400多人。公司创新的MPPA架构提供单芯片超算解决方案,具有高性能、低功耗、实时性等特点,可以为视频、网络、电信、大数据等领域的云计算应用实现实时加速,还可以为航空航天、国防、汽车等领域的嵌入式应用提供嵌入式高性能运算能力。但是,景嘉微与国外GPU巨头技术差距较大,短期内尚无可能影响人工智能GPU芯片的产业格局。
2、FPGA
FPGA为现场可编程门阵列。高密度计算、大吞吐量和低功耗的特点使其在各个行业领域有较大的发展空间。
在通信领域,FPGA主要用在通信和无线设备系统,为数据中心提供更高的能源效率、更低的成本和更高的扩展性,还可以用于 5G 的可编程解决方案;在工业领域,FPGA可实现自动化、机器视觉和运动控制;在汽车领域,FPGA成为 ADAS 的主要处理平台,提供实时图像分析与智能传输。由于 FPGA 可编程,其在提供差异化产品和快速响应上有着极大的优势。此外,CPU+FPGA 的混合结构也可用于云服务计算。
FPGA的市场发展迅速,但技术门槛比较高,目前市场上主要由Xilinx(赛灵思)与 Altera(阿尔特拉)两家公司主导,两家市场份额合计达80%以上。
(1)赛灵思(Xilinx)
Xilinx是全球排名第一的可编程逻辑完整解决方案的供应商。公司成立于1984年,Xilinx首创了现场可编程逻辑阵列(FPGA)这一技术,并于1985年首次推出商业化产品。Xilinx研发、制造并销售多种类型的集成电路、软件设计工具以及作为预定义系统级功能的IP(Intellectual Property)核。
Xilinx产品已经被广泛应用于从移动通信基站到DVD播放机的数字电子应用技术中。作为FPGA技术的发明者和产业龙头型公司,Xilinx约占全球FPGA市场出货量的50%,在高端FPGA市场(16nm、20nm、28nm)占有较大优势。公司在全世界拥有7500多家客户,包括IBM、NEC、Samsung,Siemens、Sony等知名公司。
(2)阿尔特拉(Altera)
Altera在FPGA领域长期占据领先地位,是Xilinx之外另一家FPGA寡头级企业。Altera公司的FPGA分为两大类,一种侧重低成本应用,容量中等,性能可以满足一般的逻辑设计要求,如Cyclone,CycloneII;还有一种侧重于高性能应用,容量大,能满足各类高端应用,如Stratix,StratixII等。Altera的FPGA产品被广泛应用于汽车、消费电子、军事航空、医疗、无线通信等多个领域。
2015年末Intel斥资167亿美元收购了Altera公司。Intel计划将Altera的可定制芯片和自有的标准化半导体相整合,以针对网络搜索、机器学习等特定任务打造更加高效的产品解决方案。
(3)深鉴科技(被Xilinx收购)
深鉴科技提供基于FPGA平台的人工智能加速解决方案,2018年8月被赛灵思收购。深鉴科技在深度神经网络压缩、指令集与计算架构等领域具有技术领先优势,其关于深度压缩的论文与谷歌DeepMind的论文并列ICLR2016最佳论文。2016年Open Power峰会上全球最大FPGA厂商介绍深度学习处理器新方法中的技术部分大多来自深鉴科技。深鉴科技基于FPGA的DPU产品可为多行业提供深度学习加速解决方案。相对于CPU、GPU等通用化产品具有更高的能效,目前已经应用于安防、大数据等行业。
中国其他的FPGA芯片公司,包括京微齐力、高云、安路、智多晶等,普遍还未能量产高性能FPGA,短期内尚无可能影响人工智能FPGA的产业格局。
2.2 ASIC
ASIC(Application Specific Integrated Circuits)指针对特定需求而设计、制造的集成电路。神经网络处理器是ASIC专用电路在人工智能领域的应用形态。
目前,国际龙头芯片厂商在GPU和FPGA领域对AI芯片应用竞争呈现白热化,而随着未来终端人工智能应用的兴起,为深度学习算法定制的ASIC芯片在计算速度和功耗上大大优于GPU和FPGA,伴随人工智能加速对行业渗透,未来在安防、智能终端、金融、车联网等领域,ASIC将得到广泛应用,广阔的市场空间使ASIC大规模应用成为可能。
可以预见,专用AI芯片(ASIC)将成为新晋AI芯片领域厂商与传统巨头竞争的主战场。同时,我国专用AI芯片公司与世界领先水平差距不大,某些领域位于世界前沿,ASIC将成为我国芯片行业弯道超车的关键。
当前,国内已经出现了一些面向终端人工智能的ASIC芯片企业,大致可以划分为四类:一是互联网、通信类巨头的芯片设计团队;二是存在多年的成熟的芯片设计公司;三是新创立的AI芯片创业团队/公司;四是延伸做AI芯片的算法公司,
1、互联网、通信类巨头
以华为、百度等为代表的巨头公司,在算法、数据方面具有明显优势,为了延伸实现AI应用的落地,加快了芯片端的布局,但主要集中在云端芯片上。
(1)谷歌
谷歌的TPU(Tensor Processing Unit)是一种专用的加速器芯片,跟其深度学习软件Tensor Flow 匹配。TPU 专门针对机器学习进行裁减,运行单个操作时需要的晶体管更少,其研发目的是为了替代GPU,实现更高效率的深度学习。
TPU的设计不仅仅是针对某种神经网络模型,而是能够在多种神经网络(CNN、LSTM,以及大型全连接网络模型等)中执行CISC(复杂指令计算机)的指令。在TOPS / Watt(每瓦特性能)功耗效率测试中,TPU的性能要优于常规的处理器30到80倍;而同传统的GPU/CPU的计算组合相比,TPU的处理速度快15到30倍;更为关键的是,由于TPU的运用,深度神经网络所需要的代码数量也大幅的减少。在深度学习技术迅速发展,数据和算力要求快速提高的人工智能时代,谷歌的这一替代方案将为硬件大规模减负,进一步降低人工智能的硬件成本。
(2)华为海思
华为海思作为我国芯片领域的领军企业之一,2017年发布了全球首款AI移动端芯片麒麟970,抢先一步占领AI芯片制高点,引起业界广泛关注。麒麟970采用了行业高标准的TSMC 10nm工艺,集成了55亿个晶体管,实现了1.2Gbps的峰值下载速率,创新性地集成了NPU专用硬件处理单元,并设计了HiAI移动计算架构。
2018年9月,华为海思再次发布了新一代产品麒麟980。该产品基于CPU、GPU、NPU、ISP和DDR,实现了全系统融合优化的异构架构,并创下了六项世界第一:首次使用领先的TSMC 7nm制造工艺,首次在移动端芯片搭载双NPU,首先实现基于ARM Cortex-A76 CPU架构进行商业开发等。其中,搭载的寒武纪NPU采用双核结构,其图像识别速度比麒麟970提升120%。
此外,华为海思在监控SOC芯片领域市占率全球第一,其集成AI本地推断功能的监控SOC必将在市场中占据重要位置。
(3)百度
百度联合硬件厂商推出DuerOS智慧芯片,是百度在人工智能与硬件设备一体化方面的新探索。DuerOS智慧芯片拥有低成本芯片和模组,可以以芯片嵌入的形式放到任何硬件中,能够更加快速而广泛地应用到更多场景。可以看出,百度在利用“算法+芯片”的组合实现人工智能产业化落地。
2018年7月,百度发布首款云端AI芯片“昆仑”,这是百度基于八年的CPU、GPU和FPGA的AI加速器研发经验,在中国大规模AI运算实践中,经过20多次迭代产生的芯片。相对于谷歌TPU擅长浮点计算,百度AI芯片更擅长混合精度计算,一些场景下计算性能强2-3倍,同时功耗更低,将应用于未来的自动驾驶、图像识别等领域。
2、传统芯片公司
由于人工智能算法逐渐开源和普及,一些存在多年的成熟的芯片设计企业迅速完成了人工智能算法的吸收和研究,针对特定应用领域推出了终端AI芯片。这些成熟的芯片设计公司在成本控制、芯片定义、客户渠道方面具有相当的优势。
集成AI功能的音视频SOC芯片系列可广泛应用于机顶盒、数字电视、智能音箱、平板电脑等家电及消费电子市场,应用领域众多,市场空间巨大,是消费电子的主战场之一。中国音视频SOC芯片的巨头公司全部入场,未来竞争将十分激烈。
(1)杭州国芯
作为知名机顶盒SOC芯片设计公司的杭州国芯,针对语音识别领域, 2017年推出了集成NPU(神经网络处理器)的SOC级AI芯片,其针对人工智能与物联网的特点,将算法、软件、硬件深度整合,是一颗具备高智慧、低功耗、全集成特点的全新语音交互AI芯片,能够帮助终端产品实现本地离线、低功耗和可移动的语音识别,主要面向智能音箱、智能电视、智能玩具等热点领域。
(2)瑞芯微
作为数字音视频、移动多媒体芯片研发厂商,瑞芯微2018年推出了其首次采用CPU+GPU+NPU硬件结构设计的AI芯片,其特点是融合了瑞芯微在机器视觉、语音处理领域的多年经验,硬件性能高、平台兼容性强。2019年初发布了定位于IoT领域的最新AI芯片,支持语音唤醒和识别、人脸检测和识别等。目前,瑞芯微的AI芯片已经用于喜马拉雅智能音箱、阿里巴巴人脸支付产品上。
(3)晶晨半导体
晶晨半导体是一家OTT/IPTV机顶盒以及智能电视和智能家居芯片设计公司。目前,晶晨半导体提出将在巩固智能电视技术和市场优势的基础上,融合人工智能的创新科技,积极开发含有嵌入式神经网络处理器的人工智能电视系列芯片,向万物智能互联生态迈进。产品方面,晶晨推出了12nm 超高性能六核人工智能显示芯片,内置NN(神经网络)处理器的半通用终端AI芯片,可用于智能摄像头、智能音箱等智能家居领域。
(4)全志科技
全志科技是一家专注于智能终端应用处理器SOC、高性能模拟器件和无线互联芯片的设计公司。近期,全志科技在多个系列芯片产品中融合了语音识别、图像识别的人工智能技术,具有视觉和语音算法加速模块。
(5)联发科
联发科是全球知名的IC设计公司,专注于无线通讯及数字多媒体技术。2018年底,联发科发布了内建多核心人工智能处理器的芯片P70。2019年初,联发科又将手机领域的AI专核(APU)策略引入到智能音箱及其他智能硬件中,支持终端侧AI解决方案。
3、初创芯片公司
部分高校、科研院所和海归团队,基于AI算法及芯片的技术积累,创办多家AI芯片公司,针对某些特定应用领域的需求,推出定制化的AI芯片。
(1)寒武纪
寒武纪科技的前身是中国科学院计算技术研究所下的一个课题组,早在2008年就开始研究神经网络算法和芯片,并于2012年开始陆续发表研究成果,公司创始人、首席执行官陈天石教授是处理器架构和人工智能领域享有国际盛誉的青年科学家。寒武纪主要产品是各类智能云服务器、智能终端以及智能机器人的核心处理器芯片。
2018年5月,寒武纪发布了首款云端AI芯片MLU100。该芯片采用了最新的 MLUv01架构和TSMC 16nm 工艺,可工作在平衡模式(主频 1Ghz)和高性能模式(1.3GHz)主频下,等效理论峰值速度则分别可以达到 128 万亿次定点运算和166.4 万亿次定点运算,其功耗为 80w/110w。同时,寒武纪还发布了终端AI芯片1M,也是其第三代机器学习专用芯片,1M综合性能是其前代产品十倍。
(2)地平线
地平线成立于2015年,创始人是前百度深度学习研究院负责人余凯。BPU(BrainProcessing Unit)是地平线机器人自主设计研发高效的人工智能处理器架构IP,支持ARM/GPU/FPGA/ASIC,专注于自动驾驶、人脸图像辨识等专用领域。地平线基于高斯架构的嵌入式人工智能解决方案在智能驾驶、智能生活、公共安防三个领域开始进行应用,地平线的第一代BPU采用TSMC的40nm工艺,相对于传统CPU/GPU,能效可以提升2~3个数量级(100~1,000倍左右),目前处在量产前阶段。
(3)比特大陆
比特大陆成立于2013年,是一家专注于高速、低功耗定制数字货币矿机芯片设计研发的公司。
比特大陆在2017世界人工智能大会上发布了面向人工智能应用的专用定制芯片Sophon BM1680,深度学习加速卡SC1和SC1+,以及智能视频分析服务器SS1,正式进军人工智能行业。2018年10月,比特大陆发布了新一代终端人工智能芯片BM1880,其比上一代产品性能提升5倍以上,一同发布的还有算丰智能服务器SA3、嵌入式AI迷你机SE3、3D人脸识别智能终端以及基于BM1880的开发板、AI模块、算力棒等产品,开始全力向专用终端AI芯片迈进。
(4)嘉楠科技
嘉楠科技成立于2013年,是最早专注于数字区块链计算设备的公司之一。目前推出了同时具备视觉识别和语音识别的人工智能终端芯片勘智@K210系列芯片。该芯片具备高速卷积神经网络加速器(KPU)和音频处理加速器(APU),可灵活与物联网技术、软件系统、云计算平台等相关的基础信息技术相结合,可广泛应用于广告/大数据收集、安防监控、物流检测、无人商店、疲劳安全监测、电力/电源控制、玩具及机器人等市场,并且已经在智能家居、智慧工厂、人脸识别等多个领域有成功应用案例。
(5)西井科技
西井科技成立于2015年5月,是一家开发“类脑AI芯片+算法”的科技公司,其芯片用FPGA电路模拟神经元,成品有100亿规模的仿真神经元,以实现SNN的工作方式。其产品Deepsouth与 IBM的truenorth构成竞品。由于架构特殊,这些芯片计算能力强,可用于基因测序、模拟大脑放电等医疗领域。同时,西井科技还有一款5000万个神经元的商用芯片,由于体积小、功耗低,可用于便携式医疗设备。
(6)启英泰伦
成都启英泰伦科技有限公司成立于2015年11月,是一家专注于人工智能终端芯片设计及配套智能算法引擎开发的公司。2016年9月,推出了全球首款深度神经网络智能语音识别芯片CI1006。CI1006芯片集成了启英泰伦自主知识产权的脑神经网络处理单元BNPU,也采用了ARM最为先进的MCU内核Cortex-M4F,形成专用的SoC架构,具备高性能、低功耗、高识别率、低成本等优点,可以支持本地语音检测、唤醒,以及数百条离线命令词条的识别。
(7)ThinkForce
ThinkForce成立于2017年,是一家由依图科技战略投资的智能芯片研发商。依图作为国内四大CV(计算机视觉)独角兽之一,拥有强大的AI算法能力和人脸数据库。2019年5月,依图召开发布会推出了与ThinkForce联合开发的云端深度学习推理定制化SoC芯片“求索”。“求索”采用了自主知识产权的Many Core架构,运用在依图的云端和边缘服务器上,针对视觉领域不同运算进行加速,适用于人脸识别、车辆检测、视频结构化分析、行人再识别等多种视觉推理任务。AI芯片的量产标志着依图完成了从算法到芯片的跳跃,形成了软件到硬件的垂直整合能力及完善的人工智能软硬件方案。
4、算法公司
部分AI算法公司苦于无法找到充分满足算法需求的芯片,希望依靠自身能力提供完整的软硬件解决方案,因此,开始根据自己的需求开发完全定制化的AI芯片。
随着AI算法在视觉识别和语音识别领域的快速落地,相关算法公司意识到“算法+芯片+数据”的模式能够有效实现规模化并降低成本。在语音识别领域,由于支持AI语音识别算法的终端ASIC的芯片复杂度相对较低,部分算法公司已经研发出专用于语音识别的AI芯片。主要代表有云知声、思必驰等。
图3:我国AI芯片企业分布
资料来源:公开资料、九鼎投资整理
语音语义识别是指通过语音信号处理和语义识别,使得计算机自动理解人类口述语言的技术。语音识别主要步骤为信号搜集、降噪、特征提取解码三步,提取的特征在后台由经过语音大数据训练得到的语音模型对其进行解码,最终把语音转化为文本。语义识别则通过自然语言分析,理解人类语言表达的意思。
根据Research and Markets研究预测,全球智能语音市场将持续快速增长,到2020年市场规模将达到191.7亿美元。目前阶段,语音识别应用市场主要为智能音箱、智能语音交互家电等领域,可以预见,智能语音识别还将在自动驾驶、教育、医疗等领域得到深度应用。语音语义识别的终极发展目标为多语言自动翻译技术及设备,一旦该最终目标成为现实,将有可能彻底打破不同语言之间的交流障碍,重现“巴比伦之塔”,对人类社会产生极其深远的影响。
1、智能音箱市场
智能音箱领域正在迎来爆发式增长。目前,包括亚马逊、谷歌、阿里、小米、百度、京东、华为在内的全球互联网、手机巨头陆续进入智能音箱领域, 并将其提升到战略产品的高度。一方面,智能音箱作为智能家居的入口,有望带动其他硬件产品快速增长;另一方面,通过智能音箱作为家庭数据入口,各巨头有望在未来拓展其它商业模式。
2018年全球市场智能音箱出货量约为8620万台,同比增加170%,远超市场预期。2018年中国智能音箱累计出货量超过2000万台。2018年第四季度达到860万台,阿里巴巴、小米和百度等互联网巨头占据市场前列,市场份额分别为31%、29%和28%。
表2:主要智能语音音箱出货量及采用芯片方案统计(单位:万台)
资料来源:公司官网、智东西、九鼎投资整理
2、智能语音交互家电市场
除了迅速增长的智能音箱领域,各大家电厂商也都在积极集成语音交互功能。语音交互既能为产品增加一个新颖独特的功能,也能成为家庭语音入口并持续积累用户行为信息。
1)智能电视市场
随着以小米电视为代表的智能电视逐步普及,看电视的方式在过去三年间发生了巨大的变化,年轻一代的电视观众迅速完成了从被动收看直播到主动点播甚至搜索内容的模式转变。语音交互为智能电视的内容搜索功能带来了极大的便利,将有力地带动高质量付费内容的收入增长。目前,创维、小米、暴风、海尔等均已推出智能语音识别电视。
2017年,中国智能电视销量达4736.5万台,同比增长13.8%,2018年智能电视销量将突破5000万台。预计语音交互将迅速成为智能电视的标准配置,成为语音交互技术的另一个巨大市场。
2)智能语音空调
2017年,全国空调内销量8875.5万台,同比增长46.8%。近几年,空调每年内销量保持在6000万台以上,美的、格力、海尔、奥克斯、长虹均已推出语音智能空调,具有智能语音交互功能的空调市场空间巨大。
3)其它语音交互市场
2018年以来,具备语音识别功能的儿童故事机(机器人)、自动晾衣架等产品的出货量及增速均超过预期,带来大量的智能语音识别芯片需求。根据最新的市场调研粗略估计,全国自动晾衣架年出货量超过3000万件,儿童故事机(机器人)年出货量也有望达到4000万台。预计语音识别功能的渗透率将在未来3年超过50%。
1、终端语音识别芯片集成AI模块趋势明确,但是在集成方式、功能定位方面存在不同策略。
目前,运用于终端语音识别的AI芯片分为通用型、半通用型和专用型。通用型AI芯片类似CPU,AI算法直接在主控芯片的计算单元中加速,可以保证该芯片能适应不同应用场景需要,灵活性较强,但成本和功耗相对较高,例如应用于天猫智能音箱的联发科芯片。
半通用型AI芯片采用异构设计,常为CPU+NN模块的方式,NN模块专门加速AI算法,CPU作为补充,意图在灵活性及成本、功耗取得折中,例如应用在小米小爱同学智能音箱的晶晨芯片。专用型芯片是针对语音识别设计的AISC芯片,实现更低的成本及功耗,灵活性稍弱。由于语音识别应用逐渐成熟,市场需求逐步明确,针对特定场景的高效率、低功耗专用型AI芯片将成为主流产品。
此外,目前上市的语音终端产品中,针对不同的应用市场,部署的AI算法复杂程度各有不同。有的仅实现离线状态下关键词唤醒,如智能音箱;有的则实现了关键词识别、离线对话等轻量级的语音语义识别,如智能家电;有的需要在离线状态下依然支持全功能的语音语义识别,如车载场景。
可以推断,由于AI算法尤其是训练算法的复杂性及不断演进,语音及语音识别仍将以云端运算为主。但同时,随着语音算法的进化和终端芯片的迭代升级,终端AI语音芯片将部署更多的AI算法加速模块,以实现更快的响应速度,满足车载等多元化的场景需求,与云端训练和推理互补,提升用户体验。
2、传统专业芯片设计公司的加入,加快了语音识别芯片的落地和量产。
国内杭州国芯、启英泰伦等AI芯片公司率先量产语音识别终端AI芯片,各音视频SOC芯片巨头公司联发科、瑞芯微、全志、晶晨也逐步推出类似产品。专业芯片设计公司与算法公司合作,凭借自身成熟的芯片设计、产品定义和成本控制能力,推出了低成本、低功耗、可离线唤醒和语音识别功能的AI芯片,应用于在智能音箱、智能家电等终端产品中,预计2019年出货量将达到千万级,未来3-5年将保持快速增长。
3、算法公司开始延伸至芯片设计环节,形成算法和芯片公司既互补又竞争的格局。
国内语音识别算法公司中,科大讯飞占据主导地位,同时有云知声、出门问问、思必驰、ROKID、依图科技等知名的初创AI公司,形成一超多强的局面。各家在算法总体水平上相对接近,各有擅长的细分领域。
为了更好的将算法方案落地并通过规模化降低成本,部分语音算法公司开始自研AI芯片,推出能够加速自有算法的AI专用型芯片,帮助其更快的在特定应用领域形成落地应用。部分算法公司通过合资设立芯片公司、与传统芯片公司合作开发等多种方式进入AI芯片领域。算法及方案公司开发芯片,可以更加准确的把握其自身的功能需求,但其在产品定义、成本控制、研发周期、供应链管理等多个环节的竞争力还有待时间检验。
(1)科大讯飞
科大讯飞是国内语音识别领域唯一的上市公司,拥有全链路的语音识别技术,建立了开放的云平台,利用AI算法技术和平台级业务,将语音能力授权给第三方。
目前,业务已从政府、教育领域拓展至医疗、车载和消费电子等领域。在医疗领域,科大讯飞与商汤合作,推出图像诊断加自动问诊人工智能医疗平台;在车载领域,全力推动前装市场,替换传统巨头Nuance的市场份额;在智能音箱领域,与京东设立合资公司叮咚,但2018年合作终止,叮咚音箱成为京东子公司。科大讯飞内部有一支专门研发AI芯片的团队,取得了阶段性成果。
(2)思必驰
思必驰从教育领域语音识别起家,拥有很强的本地语音识别技术。目前正全力进入车载、家居语音行业。在智能音箱领域,为国内一半以上产品提供语音识别算法和方案,合作方包括小米小爱、天猫精灵、华为和网易等;在家居方面,2019年开始推广早教故事机等消费电子。2018年,思必驰联合中芯国际成立的合资公司深聪智能推出语音终端AI芯片,将思必驰的算法和芯片架构深度融合,推出低功耗终端AI语音芯片,目标市场为智能家居领域包括音箱、电视、白色家电等。
(3)云知声
云知声具有全链路语音识别技术,主要布局物联网语音识别,在家居和车载领域较为突出,客户覆盖格力、美的、长虹等,同时服务近100家车载语音识别方案和品牌商。目前,云知声业务拓展至医疗、司法等领域。云知声是最早成立芯片设计团队的AI语音算法公司,2018年量产首款AI芯片,2019年将量产第二代面向物联网领域的AI芯片,主要面向白色家电。
(4)出门问问
出门问问的策略是软硬件一体化,通过智能音箱以及智能手表和耳机等可穿戴设备切入,逐步扩展到车载和家居场景。与战略投资者谷歌深度合作,排名全球智能手表销售量前四;与战略投资者大众汽车深度合作,已经进入车载前端市场,推出语音输入导航、信息点搜索、即时通讯等功能的智能后视镜。与杭州国芯合作推出了“问芯”AI语音模组。
(5)ROKID
ROKID在2017年携手阿里推出全栈语音开放平台,为业界提供一站式语音解决方案和开发者平台,面向全行业开放语音识别、语音合成、语义理解、声纹识别、麦克风阵列、信号分析处理等多项技术。同时,ROKID也在2018年与杭州国芯合作推出自己的AI芯片KAMINO。
(6)其它
此外,由于语音识别在人工智能领域中较为成熟、落地最早,陆续有互联网和算法公司开始进入该领域。
百度和搜狗主要以电脑和手机端的输入法为技术基础发展语音识别,在物联网终端需要的声音信号处理、多麦克风阵列的噪声控制、声源识别等算法上积累较少。依图科技作为计算机视觉识别领先企业,在2018年底发布了语音产品,在权威中文普通话数据集测试重表现较好。猎户星空作为自主研发语音交互、图像识别、视觉导航等全链条人工智能技术的初创公司,其搭建了数十名人员构成的芯片开发团队,与瑞芯微合作推出了语音识别AI芯片OS1000RK,目前用于喜马拉雅音箱。
表3:五大语音识别公司对比
资料来源:企业公开资料、九鼎投资整理
1、目前,AI语音芯片处于发展初期,多家成熟芯片设计公司、算法及方案公司和初创芯片公司正陆续推出AI语音芯片。
当前AI语音芯片企业可以大概划分为四类:一是互联网、通信类巨头的芯片设计团队;二是存在多年的成熟的芯片设计公司;三是新创立的AI芯片创业团队/公司;四是延伸做AI芯片的算法及方案公司。
其中,互联网和通信类巨头在算法和数据方面具有一定优势;成熟芯片设计公司在成本控制、芯片定义、供应链管理、客户渠道方面具有优势;初创芯片公司在芯片前沿架构和定制化方面具有优势;算法及方案公司在整合芯片下游算法和应用方案上具有优势。如果算法和应用方案持续快速演进,互联网巨头及算法公司将占据一定优势;在市场需求趋于稳定后,成熟的芯片设计公司将逐步获取优势。
2、中短期内,终端AI芯片受下游需求拉动,将快速发展。
第一,人工智能在很多场景已经实现了商业化运用,大部分场景均需要本地化的推断运算,因此终端AI芯片必不可少,且需求巨大。尤其在视频监控、智能家居、无人驾驶语音交互等领域,支持本地推断功能的终端AI芯片将是实现人工智能落地的关键要素。
第二,终端AI芯片根据具体应用场景深度定制,需求明确,芯片公司可以在设计架构层面进行算法实现的创新、压缩和优化,实现高效的轻量级人工智能,算法及芯片开发技术难度低于云端芯片。
3、近期,语音识别是终端AI芯片落地的重要领域,形成了算法和芯片公司既互补又竞争的格局。
由于传统芯片设计公司和算法及方案公司的共同发力,具备语音识别AI算法加速功能的终端AI芯片逐渐成熟,尤其是传统芯片公司的加入,推出了多款低成本、低功耗的AI语音芯片。虽然,目前各种语音识别终端AI芯片在集成方式、功能定位方面存在不同策略,但是在终端芯片集成AI语音识别功能的趋势已经很明确。能否更好的与云端互补,实现更强的AI算法加速能力,在性能、成本、功耗等多方面取得平衡,将考验终端AI芯片厂商的综合实力,也是未来行业内公司最关键的竞争力体现。
4、长期来看,云端ASIC AI芯片发展潜力巨大,是人工智能巨头的战略必争之地。
由于云端训练算法十分复杂,并且还处于持续发展过程中,短期内GPU/FPGA等灵活性较高的芯片依然将占据市场主流地位。待人工智能算法基本稳定,且规模化人工智能时代到来后,云端ASIC AI芯片才会迎来爆发式增长。
未来随着人工智能技术的不断发展成熟,数据的处理能力将成为最重要的生产要素,开发拥有强大训练和推理能力的云端AI芯片是各大人工智能企业的关键目标。因此,长期来看,云端ASIC形态的AI芯片将成为人工智能时代各巨头的战略必争之地。由于云端人工智能芯片与信息安全关系紧密,该领域也将成为各国政府关注的焦点。
作者介绍:
孟伟,半导体、TMT投资部董事总经理
九鼎投资董事总经理,九鼎半导体产业基金负责人。半导体/集成电路及硬件行业专家,拥有近15年半导体行业从业及投资经验。曾任职于开翼资本、SK电讯中国基金等半导体产业基金,参与投资管理多个半导体产业链项目,并拥有多年初创半导体公司管理经验。天津大学电子工程专业硕士、学士。
冯卓,半导体、TMT投资部投资总监
西安交大工学和管理学双学士,中国社科院经济学博士。曾任职于中国兵器装备集团,完成多起智能制造和汽车产业链投资。现任职于九鼎投资,重点关注半导体及硬科技领域投资机会。主导完成半导体测试设备、人工智能等多个投资项目。