编者按:本文来自微信公众号“电动星球News”(ID:glxsl2017),作者:毓肥,36氪经授权发布。
大概一个月之前,马斯克放出了可能是今年特斯拉最重大事件的预告。
4 月 15 日,马斯克在推特回复网友称, 特斯拉的 AI Day 专场发布会,预计会在「7 月底 late July」举行。
继 2019 年 4 月 23 号自动驾驶日 Autonomous Day、2020 年 9 月 23 日电池日 Battery Day 之后,特斯拉第三次以「Day」命名的技术发布会,终于正式定档。
自动驾驶日上,特斯拉掏出了世界上首枚由车企研发的自动驾驶计算芯片 FSD Chip,并发布了算力高达 144TOPS 的 Autopilot 硬件 3.0, 总体算力至今依然没有量产车望其项背。
电池日上,马斯克放出了年产能 TWh 级别的全新电池工厂,发布了下一代 4680 电池,以及融合了电化学、生产优化,以及车辆工程之后续航提升 54% 的宏大目标,还有三电机+超长续航的新款 Model S。
于是,我们没有理由不期待,马斯克会在 7 月底的 AI 发布会上,放出更多「核弹」,为自动驾驶的 2021 打上更多花火。
当然,按照前两次发布会的调性,大家一定要做好 AI Day 跳票,甚至多次跳票的准备。不过这不影响我们根据现有的线索,揣测一下特斯拉到底会在 AI Day 上发布些什么。
不用担心,今天的文章不只有枯燥无味的数字,我们会争取写得更让人心潮涌动一些。
根据 2020 下半年的全球 TOP500 计算机排名,目前已投入使用的超级计算机中,日本富岳 Fugaku 超级计算机以 431.65PFLOPS 的 FP32 精度算力,排在榜首,大概是第二名的3倍。
2020 年 8 月 16 日,马斯克首次披露了特斯拉 DOJO 超级计算机计划的目标——FP32 精度 1EFLOPS 的算力,也就是 1024PFLOPS,富岳的 2.5 倍。
DOJO,也就是特斯拉 AI Day 的最大看点之一,一套来自车企的超级计算系统。它 是特斯拉自动驾驶计算补齐的最后一块拼图 ,甚至有可能是新时代车企「灵魂」的最终体现。
我们讨论自动驾驶时,常用的 TFLOPS 算力,其实是基于 INT8 精度衡量的。换算成 FP32 精度的话大致要除以 4。也就是说,特斯拉 Autopilot 硬件 3.0 的 FP32 精度算力大概是 36TFLOPS。
换算一下就是, 一个 DOJO 系统的算力,起码相当于 29127 辆特斯拉硬件 3.0 车型算力之和 。
1EFLOPS 的算力当然很恐怖,但傲视群雄的 DOJO 担子依然不轻。
根据 thecarconnection.com 的统计数据,2014 年全美驾驶者平均每天开车 52 分钟。
以特斯拉硬件 3.0 车型保有量 100 万辆计算,一套 DOJO 纯粹基于平均时间值换算,每天大约需要处理超过 2500 万辆次汽车反馈的数据。
当然,DOJO 主要负责的是「训练」,这样计算它的压力不严谨。但另一个幸福的烦恼是,特斯拉卖得真不错。
刚刚过去的 1 季度,特斯拉一共交付了超过 18 万辆汽车,这些车型全部搭载了 Autopilot 硬件 3.0, 算下来今年特斯拉或将售出 73 万辆汽车,甚至有机会超越雷克萨斯。
按照这样的趋势,再过一阵子,马斯克曾经引以为豪的「百万级自动驾驶数据反馈车队」,就会变成每年「自豪」一次的幸福烦恼。
DOJO 如何适应迅速累积的 Shadow mode 数据反馈规模,比起 DOJO 本身,也许是 AI Day 更值得关注的命题。
灵魂需要肉体承载,DOJO 是坐镇特斯拉总部的大脑,而分散于世界各地的 Autopilot 硬件,则是神经网络的每一个末梢。
DOJO 超算目前面临的内部挑战有两个:特斯拉卖得太火,也就是 数据反馈越来越庞杂 ;以及特斯拉做得太多,也就是 来自每一个「神经末梢」的数据压力,会越来越大 。
「做得太多」对应的,就是马斯克 Autonomous Day 上承诺会在「两三年内」推出的二代 FSD Chip,以及它的载体 Autopilot 硬件 4.0。
根据台湾工商时报报道,二代 FSD Chip 将交给台积电量产,使用 7 纳米工艺制造,由博通和特斯拉一起设计。
台湾媒体报道的另一个消息,是 「每块 7 纳米晶圆只能切割出 25 片 FSD Chip 2 代芯片」 ——一块 7 纳米晶圆面积是 70650 平方毫米 ,而初代 FSD Chip 面积只有 260 平方毫米 。
所谓的「X 纳米工艺」,一般指的是晶体管边长为 X 纳米。根据摩尔定律,同样面积的芯片,其晶体管数量每隔 18 个月就会翻一番,而边长就是计算晶体管密度的重要因素。
一般来说,同样架构下等量的晶体管密度提升,就会带来相近的性能提升幅度。也就是说,同样面积下晶体管数量翻一倍,理论上性能会接近翻倍。
原理说得差不多,可以直接下结论了: 二代 FSD Chip 在晶体管密度突飞猛进的基础上,芯片面积同样百尺竿头——最后的结果就是算力大爆炸。
我们用数字大概预测一下。
2019 年 11 月 7 日,特斯拉 AI 部门高级主管 Andrej Karpathy 在 PyTorch Developer Conference 2019 上面,公布了这样一个数字: Autopilot 硬件 3.0 的工作功耗是「sub 100W 低于 100 瓦」 。
算下来硬件 3.0 总体的效率起码是 1.44TOPS 每瓦 ,而使用了 12 纳米工艺的英伟达 Xavier,芯片层面的效率大概是 1TOPS 每瓦 (30W/30TOPS)。
初代 FSD Chip 用的是三星 14 纳米工艺,而 FSD Chip 2 代用的台积电 7 纳米工艺,理论晶体管密度 是三星 14 纳米的 3.5 倍 。
即使不考虑架构优化,硬件 4.0 也有望提供 6TOPS 的每瓦性能,也就是 100W 系统功耗,可以输出 600TOPS 的算力。
而英伟达最新的 Orin,系统级效率「只有」 3.08TOPS 每瓦(130 瓦/400TOPS)。
考虑到蔚来已经将自动驾驶计算系统的功耗上限,拉到了 200W+ 级别。一旦马斯克想狠狠来一把军备竞赛,也许 1000+,甚至 2000TOPS 才是硬件 4.0 的星辰大海。
当特斯拉每年卖出 100 万辆装有硬件 4.0 的汽车,DOJO 会不会喊一句「宝宝心里苦,但宝宝不能说」?
如无意外,新一代 Autopilot 硬件会沿用 8 摄像头的配备。虽然数量大概率不会变, 但下一代 Autopilot 摄像头的质量,很有可能迎来飞跃。
想要理解「飞跃」到底是什么,虽然技术路线不同,我们依然得先看看其他厂商。
年初的 NIO Day 上,蔚来首发了车规级的 800 万像素摄像头。
它可以以 4K 级别的精度收集视频数据。对比之下,目前辅助 Autopilot 硬件的,依然是 120 万像素摄像头。
其实符合车规级稳定性要求的高像素摄像头,多年前就已经出现,但却一直无法应用于 ADAS/自动驾驶,主要原因很简单—— 没那么强的车规级芯片处理如此庞大的数据流。
2020 NIO Day 上,李斌介绍称蔚来的 AQUILA 系统每秒会产生高达 8GB 的视频数据——8GB 相当于 1 秒钟看完 3 年 NIO Day 回放,或者 1 秒钟看完 2000 个抖音短视频。
2022 年开始,特斯拉/英伟达系在计算端万事俱备,800 万级别像素,将会顺理成章地成为 ADAS 行业下一个军备竞赛的必争之地。
1016TOPS 算力的英伟达 Orin 系统加持下,蔚来拥有了处理多个 4K 视频流的能力。同样将迎来算力爆发的特斯拉,没有理由不让 DOJO 看到更清晰的世界。
不过,高像素,只是自动驾驶视觉新时代的其中一个主旋律,我们下面结合具体的产品继续深挖。
先看一位车规级 800 万像素摄像头主要供应商:安森美 Onsemi。目前的 120 万像素 Autopilot 摄像头,就使用了来自安森美的 AR0136A 。
AR0820AT,这是安森美新一代旗舰自动驾驶摄像头型号。
它支持拍摄 3840x2160 分辨率,40fps 的 HDR 高动态范围视频 ,静态分辨率高达 830 万像素(3848x2168),同时符合 ASIL-B 级别车规认证。
除此之外,三星、索尼等主流 CMOS 厂商均已推出了 4K 车规级感光元件,比如 索尼 IMX324/424、三星 S5K2G1 ,都支持 4K 40 帧的 HDR 视频拍摄。
4K、40 帧(或更高)、HDR ,这就是自动驾驶摄像头新时代三大主旋律。
4K 和 1280x960 相比, 分辨率达到了 6.75 倍 ,视频数据可以准确显示更远处的路况,以索尼 IMX324 的产品说明为例,4K 分辨率下远处的交通标志清晰可见:
40 帧则是画面流畅度(目前主流是 30 帧)的进步。 视频帧率越高,视频中物体运动过程就会越流畅,有利于深度学习的预测和决策 。
而 HDR,则是摄像头向人眼靠近的另一大步。
HDR 的全称是 High Dynamic Range 高动态范围。简单点描述 HDR的效果,就是 极暗处(比如树荫下)不会黑成一片,极亮处(比如正午太阳下)也不会白成一片 。
也许人眼已经对纷繁的世界习以为常,但对于汽车视觉来说,「工业革命」才刚刚开始。
DOJO、Autopilot 硬件 4.0、4K 摄像头,这是我们对特斯拉 AI Day的期待。
然而,AI Day 不仅是特吹的狂欢,它同时带来了汽车工业的思考: 下一个时代的车企「灵魂」在哪?
先提一个业内观点: 主机厂也许是更好的自动驾驶公司。
这个逻辑的起点很简单,因为主机厂拥有车辆制造权和运营权,丰田大众这样的车企,年销售规模甚至是千万级的。比起买几十几百辆车搞实验的自动驾驶技术公司,主机厂自研自动驾驶的数据基础极其优渥。
但优渥不代表门槛低。
摄像头→FSD Chip→车辆决策→DOJO 超算训练→软件 OTA 更新,这是特斯拉的自动驾驶闭环阳谋,但每一个环节,都是对传统车企的灵魂拷问:
传感器数据是否 100% 可控可收集?
计算硬件是不是「know how」级别地利用?
视觉融合是供应商包办还是自己搞定?
深度学习模型要不要自己训练?
能否在一个电子电气架构上做到长期更新,常用常新?
上文提到新车企「灵魂」,我们从不和稀泥,于是经过全文铺垫后,可以说得直白点:
新车企的灵魂不是旧时代的「制造」,而是融合了人工智能、软件开发、电子硬件架构等 ICT 行业特征的自研能力。
如果以上能力缺了一坏,甚至几环,你们觉得能叫「新车企」吗?