编者按:本文来自微信公众号“CSDN”(ID:CSDNnews),作者:马超,36氪经授权发布。
“时来天地皆同力,运去英雄不自由”。
计算机背后的集成电路已由上世纪 40 年代占地 150 平方米、重达 30 吨的庞然大物,演进成仅有手指般大小的超高密度的电子芯片。芯片是 IT 时代的算力底座,市场规模近万亿美元,但这个领域一直是我们被“卡脖子”的软肋。
近日,接连不断的并购案和频繁涌现的新品发布,让芯片行业处于前所未有的大变局之中。
去年 9 月,英伟达宣布以 400 亿美元的价格从软银手中收购 Arm,以加强自己在 CPU 方面的短板,凭借 CPU+GPU 的方式正式进军云数据中心;10 月,英特尔宣布将 NAND 业务以 90 亿美元的价格卖给 SK 海力士;同月,AMD 收购 FPGA 行业的巨头 Xilinx,同样剑指云数据中心;而这样纷繁复杂的局面在一代神芯苹果 M1 发布之后变得更加扑朔迷离。
不仅如此,近期英特尔也官宣将在一个月后换帅,现任掌门人 Bob Swan 此前是英特尔的财务官,缺乏技术方面的专业背景。可能也正是由于这方面的欠缺,英特尔在技术层面衍生出许多问题,迟迟陷在 14nm 制程上无法突破,也带来了"火线换帅"的局面。
此外,另一巨头英伟达带着 RTX3060 也正式登场,并采用了 3584 CUDA 核心,GPU 频率可达 1.78G Hz,配备了 12GB 的 GDDR6 显存,可以说英伟达在显卡市场上也开始拼尽全力了。
在此趋势下,我们不仅要看清芯片巨头们的竞争格局,更要躬身入局,加快我们自身的追赶步伐。也希望本文能为正走在这条道路上的技术人们带来一些思考。
众所周知,IT 界每十年就会产生一种新的生态,如二十年前的 Wintel 的 PC 生态、如十年前 Android、iOS+ARM 形成的移动终端生态,未来的一两年内,想必也会有新生态形成,因此哪种芯片能够领先竞争对手,那么谁的生态就可能笑傲江湖,而统治 IT 生态对于科技巨头而言是保持基业常青的最大砝码,这也是苹果耗费巨大精力也要打造出 M1 的主要原因。
M1 的优胜原因在于,目前计算机的体系架构更偏向于划定界限明确分工,CPU、内存等模块都是彼此都是独立的,不过 M1 打破了这个潜规则,本质上 M1 并不是一颗传统意义上的 CPU,而是 CPU、GPU、内存乃至协处理器集成在一块 SOC 上的微型主机。
不过,这样做的缺点是扩展性差,使用 M1 的主机无法扩展内存,但这样的好处也非常明显,集成式 SOC 所带来的性能提升令人惊叹。据最新的评测来看,M1 的单核得分超过了 AMD 最新的 ZEN 3 架构的 Ryzen 9 5950X 和 Intel i9-10900K。
M1 不仅 CPU 性能强悍,它的图形性能也很出众,已经完全脱离了之前业界对于集成显卡的理解范围。据数据显示,M1 的显卡性能与英伟达的 GTX 1650 与 GTX 1050Ti 之间,比目前轻薄本主流集成显卡性能高出好几个数量级。
另外,M1 的功耗也非常低。据网友用《古墓丽影:崛起》进行测试案例结果时,M1 的平均功率分别是 CPU 7.5W、GPU 7W,作为对比仅是 1650 显卡功率要求就有 75W。
这样的表现除了对笔记本桌面市场带来一定震撼外,也为云数据中心指明了一条道路。毕竟,云数据中心不仅对于电力消耗的要求极其高,而且如何为服务器降温更是一个巨大的课题,业界中如微软、Facebook 等企业此前为了解决这一难题甚至将数据中心建到海底,阿里云也有液冷服务器的技术,当然这些都是针对 CPU 这个耗能大户设计的,如果能 CPU 耗能低到 10w 以内,将对于云计算服务商产生巨大的吸引力。
目前云操作系统基本是 Linux 的天下,这意味着,一旦低耗能高性能的 M1 可以平稳运行 Linux,那么云平台和 Android 平台的大量生态级应用就可以全部被 ARM 和开源的联盟收入囊中,这样带来的可能性正是开源社区正在全力向 M1 上移植 Linux 的原因,而如何面对 M1 集成式 SOC 的趋势将是今后各大巨头的必须要回答的问题。
相比之下,另一科技巨头英特尔的处境似乎不太好,一直以来 CPU 领域的跟随者 AMD 已经大有后来者居上的气势,不但推出了 ZEN3 架构的 CPU,制程 7nm 性价比也全面超越它,并且还收购了人工智能领域 FPGA 芯片巨头赛灵思。
英特尔在 14nm 制造上迟迟无法突破,而苹果这样的消费者硬件厂商,对于先进制程芯片带来的节能效应还是非常看重的,因此苹果发布自研 M1 终止与英特尔合作,这使得英特尔无论如何也不能再挤牙膏了。
英特尔于日前宣布任命帕特.基辛格为新任 CEO,与前任 CEO 财务出身不同,基辛格是与英特尔一起成长起来的技术专家,新帅基辛格的回归势必要剑指先进制程。
不过,近来以来,芯片市场中桌面业务明显趋于萎缩,而云计算领域却是不断增长,英伟达收购 ARM、AMD 收购赛灵思其实都是在布局云数据中心。在这里,不得不提一下基辛格的前东家,2012 年,基辛格接手 VMware CEO 一职,经过多年的努力,如今 VMware 在云计算方面几乎没有敌手,取得了营收翻 3 倍的成绩,且在虚拟化云计算领域也是佼佼者,因此基辛格的王者归来,让大家对英特尔充满了期待,也相信英特尔将很快会重新取得突破,迎来崭新未来。
在显卡市场,一直被英伟达(NVIDIA)吊打的 AMD 也在近期迎来了高光时刻,AMD 在去年年底发布的 RX6000 系列显卡在很多方面几乎反过来压制了英伟达同级别的 GPU。事实上,制约显卡性能最大的因素在于带宽,而RX6000 系列有 RDNA 2 无限缓存技术的加持,相比 RDNA 带宽提升 50%,频率提升 30%,这意味着 RDNA 2 的默频可以轻松达到 2G 以上,这对于性能的提升幅度将是巨大的,而微软官宣 XBox X|S 是全球唯一搭载 RDNA 2的游戏主机平台,这样的表态可以看作是微软对于 AMD 显卡性能的一种“背书”。
而 AMD 能在 CPU 领域与英特尔一较长短,在 GPU 也能和英伟达正面较量的关键原因还是在于制程。
此前,由于财务原因,AMD 在 2008 年底卖掉了自己的晶圆厂,自此以后,AMD 的主要芯片代工制造商就是台积电,这样的结盟使得 AMD 能够率先用上 7nm 的制程。正如我们上文所说,能掌握先进节能的芯片,对于 IT 厂商建立自身生态意义非凡,因此才会出现众巨头争抢台积电产能的情况。
凭借对先进制程的把握与高超的芯片工艺水平,近些年来,英伟达也将很多之前属于三星的订单转投给台积电,根据今年三季度的财务,台积电这家芯片制造业的巨头今年的毛利润率已经达到了 53%,这代表他们芯片制造的成本还不到出厂价的一半,这在世界 500 强的公司当中是绝无仅有的,甚至远超被称为 IT 界奢侈品牌的苹果公司。
建设和维护晶圆厂实在太花钱了,还需要不断按部就班的升级工艺,业界目前也就台积电和三星两大玩家。由于分工的明确化,台积电从起家就一直专注于芯片代工,不仅工艺升级非常快,而且在良品率上也很让人满意,而且台积电多年来从来没有涉及过芯片设计,对 AMD、英伟达这类客户芯片 IP 保护工作做的非常好,也正是由于专注在芯片制造,台积电才有精力和财力把业务做好做大,这也符合未来芯片行业的分工趋势。
基于以上,在看清巨头的纷争后,我们还是要解决自己的问题,在打压了华为、大疆以后,最近美国又把目光盯上了小米、中微电子等公司,通过分析巨头们的策略,笔者认为针对芯片的不同领域,我们需要采用不同的策略加以应对。
EDA 其实是工业软件计算机辅助设计 CAD 的一个分支,依靠 EDA 工具,芯片设计人员可以从概念、算法、协议等开始设计电子系统,完成电子产品从电路设计、性能分析到设计出 IC 版图或 PCB 版图的整个过程。
有数据显示,2018 年全球 EDA 市场规模还没突破 100 亿美元,EDA 相对于几千亿美元的芯片产业来说从产值上看根本不值一提,不过少了 EDA 整个芯片产业都得停摆。EDA 市场前三位的 Synopsys、Cadence 和西门子在我国 EDA 的市场份额达到 95% 以上,因此 EDA 软件是我们芯片行业亟待突破的第一关。
EDA 行业是一个典型的小而美的行业,可分为前端和后端,前端主要负责逻辑实现,后端跟工艺紧密结合。
与 MATLAB 等工业软件一样,EDA 的前端技术需要最新逻辑元件的资料输入,不过大部分国产 EDA 厂商还无法支持 7nm 的逻辑元件,与台积电、三星等顶级芯片制造商的联系较少,巧妇难为无米之炊,没有最新工艺资料 EDA 前端,很难真正做好。
EDA 后端则需要高质量的模拟与仿真,这需要长时间的技术积累,乃至不断地并购才能保持自身在技术迭代的浪潮中保持优势的方法。笔者认为想解决国内的 EDA 软件问题,或可从以下几个方面入手:
国家层面不断推动企业整合。这方面美国的经验非常值得我们借鉴,他们的 EDA 企业并非没有过恶性竞争,不过政府并没有放任这种竞争的持续而是直接出手干预了市场。EDA 三巨头之一的 Synopsys 成立以来,就发起几十余项并购交易,不断寻找那些在 EDA 功能模块中做得比较有特色的成功企业进行并购,从而使得自身能够覆盖前后端整个设计流程。
尤其是 2002 年 Synopsys 在美国商务部、司法部的牵线下,以 8.3 亿美元收购了 Avanti 公司,使得 Synopsys 成为 EDA 历史上第一家可以提供顶级前后端完整 IC 设计方案的领先 EDA 工具供应商,并在 2008 年超越 Cadence 成为全球最大的 EDA 工具厂商。
而值得注意的是,在此之前 Avanti 一直与 Cadence 公司深陷于专利官司之中,这场并购几乎由美国政府主导,也正是通过这样的并购,使得美国的 EDA 公司结束了专利内斗,迅速拓展并占领了海外市场。
持续提高投入。以 EDA 的三巨头为例,从三家公司财务来看,其最大支出部分用于产品的研发,其中 Synopsys 和 Cadence 这两家公司在 2019 年的研发支出超过了 20 亿美元。
加大人才培养力度。综合来看,国内包括芯愿景、华大九天等在内的 EDA 公司,最大短板在于研发力量的薄弱,而我们需要不断加强人才的培养与输出。
既使有了 EDA 软件,进行芯片设计了,我们的芯片设计师们在动手之前,也必须先决定芯片的指令集。
指令集之所以重要,举例说明,正如 x86 芯片中有 SSE(Stream SIMDExtentions)数据流单指令多数据扩展,SSE 系列指令提供了 8 个 128bit 的寄存器进行 SIMD 操作。
目前主流的 CPU 是 64 位的,即在一个 CPU 振荡周期都只能处理 64 位长的数据并得到一个 64 位长的结果,而 SSE 的扩展恰恰就是可让 64 位的 CPU 在一个周期内对 128 位长的数据进行处理并得到 128 位长的结果,从而大幅提高双精度数据的处理效率。因此我们看到很多用于科学计算的软件包底层都是使用 C 语言内联嵌入 SSE 汇编指令的代码进行性能优化,并取得极好的效果。而 ARM 系列芯片的成名之作就是大小核,其中大核专门针对性能优化,小核专门针对功耗优化,可谓忙时用大核干得欢,闲时用小核歇得爽。像这样的芯片指令集都是被专利保护的,想使用必须得到 IP 授权,因此指令集也是一个我们必须直面困难的领域。
目前我国拥有完整知识产权的芯片指令集就是龙芯在去年底时发布的 LoongArch。LoongArch 是一种可以支持模拟运行 x86 或者 ARM 的指令集,因此可以深度兼容 Windows、Linux、Android 程序,但是这种模拟运行也有性能损耗,而且从目前来看这种性能代价还是不小的,当然据笔者所知龙芯目前正在全面优化虚拟化模拟的代码,以尽力将损耗压缩到 20% 以内。
除了 LoongArch 以外,RISC-V 也是一个突破方向。
RISC-V 是 2010 年新出现的开源精简指令集架构,架构设计上没有历史包袱,采用的理念和方法较为先进。和主流架构 x86/ARM 相比,RISC-V 架构篇幅更少,基本指令集更少,支持模块化和拓展性,而且为贯彻开源精神,目前 RISC-V 基金会已经有搬迁至瑞士的计划了,不过 RISC-V 架构出现时间晚,适配软件和工具方面沉淀不足,目前虽然由阿里达摩院推出了号称最强 RISC-V 的玄铁 910 芯片,不过总体上讲其生态环境构建尚需时间。
与 EDA 相同,晶圆制造也是一个需要时间积累的领域。在制造领域需要光刻机、光掩膜、光刻胶与芯片工艺相结合才行,这其中涉及太多基础物理、化学方面的知识。
不过我国光刻技术的起步并不晚,早在上个世纪 60 年代,中科院就开始研究光刻机了,并且在 1965 年就研制出 65 型接触式光刻机,1972 年武汉无线电元件三厂编写的《光刻掩模的制造》的书中,具体讲述了当时那个时代,我们光刻技术的发展历程,后来 1980 年中国清华大学第四代分布式投影光刻机获得成功,将光刻精度缩小至 3 微米,这个制程与当时国际先进水平非常接近,有关这段往事笔者曾经在前文《国产芯回忆录:造光刻机的去卖早点,搞 EDA 的去组装电脑》中介绍过了,这里不加赘述了。
而我们想在芯片制造方面突破,最关键的还是要靠国家层面的政策支持与引导。
此外,我们也必须清醒的认识到,芯片虽然是 IT 领域的核心产业,但芯片制造却更偏向于基础科学的属性,只能结硬寨,打硬仗,没有捷径可言,这里笔者也呼吁业界同仁给予华为以及我国整个芯片业以更多耐心,以期破壁图强,逆境重生。