编者按:本文来自微信公众号“汽车之心”(ID:Auto-Bit),作者:叶方,编辑:王德芙,36氪经授权发布。
当面向云端的高性能计算机 Dojo 与车端最强的 HW4.0 硬件碰撞在一起时,会对特斯拉的自动驾驶产生什么化学反应?
这会成为特斯拉自动驾驶的下一个「大杀器」吗?
粗略计算,特斯拉目前有超过 82 万辆搭载 HW 2/3 硬件的的汽车在全球各地行驶。以用户平均每天驾驶约一个小时计算(每辆车 8 个摄像头),车队每月大约会产生 1.968 亿个小时的视频。
这带来的问题是,如果用人工来标注这些数据,因为数据量太大,标注起来非常困难,成本也非常昂贵。
于是,去年 4 月的 Autonomy Day 上,特斯拉 CEO Elon Musk 释放出了一个重要信号:特斯拉将把针对自监督学习技术的研发放到绝对的优先级(注:这里的自监督学习就是无监督学习)。
Musk 表示:「车端搭载的是一个针对推理优化过的计算平台(指当时发布的FSD)。在特斯拉内部,我们还有一个代号为 Dojo 的重大项目。它是一台超强的训练计算机,Dojo 的目标是能够输入大量数据,并对视频进行无监督的大规模训练。」
这里有一个值得关注的信息是:Dojo 所处理的数据不再停留在图片层面,而是针对视频类的数据。
Dojo 在日语是「道场」的意思,指练习冥想或者武术的地方。
在 Musk 的语境下,Dojo 则是特斯拉训练自动驾驶算法的「道场」:系统可以通过自动化的工具主动选取最有指导意义的训练样本,筛选、清洗、标注这些视频片段,然后完成高效的算法提升。
这也是 Musk 对超级计算机寄予厚望的原因。Dojo ,无疑扮演算法优化加速器的角色。
深度学习大神 Yann LeCun 预测称,研究人员即将在视频自监督学习方面取得突破性进展。他预计,今年深度学习的从业者就能够真正在视频数据的基础上进行自监督学习。
特斯拉 AI 高级主管 Andrej Karpathy 在最近一次的公开分享也表达了类似的预期:Dojo 训练计算机的目标,是以较低的成本实现算法性能的指数级提高。
过去的训练数据依赖于人工标注,而主动的自监督学习可以大幅优化算法提升的效率。在带宽、数据存储或算力短时间内无法快速提升的前提下,主动学习依然能让特斯拉在「绑住手脚」的情况下优化神经网络性能。
鉴于 Musk 手握超过 82 万辆「数据采集机」,特斯拉拿到优质数据的机会能比竞争对手们高出几个数量级。
借助计算视觉,特斯拉在数据规模上具有优势的可不仅是自监督学习或弱监督学习,得益于主动学习,特斯拉在传统的完全监督学习领域也一骑绝尘。
还记得在 2019 年的投资者日上,Musk 表示,Dojo 是特斯拉目前最关注的项目之一。换句话说,Dojo 是特斯拉继 FSD 芯片之后,在自动驾驶领域的又一大杀手锏。
如进展顺利,Dojo 可以改善 Autopilot 的工作方式——Autopilot 正以「2.5D」(2D图像 + 内容标注)方式进行训练迭代,而Musk打算升级,使其可以在「4D」(3D 加上时间维度)环境下运行。
Musk 对 Dojo 的评价是,「这将是一台真正的性能猛兽。」
目前,特斯拉团队仍在开发 Dojo。
根据 Musk 本人的推特上,特斯拉将在「六到十周内以有限的公开发行形式」发布这项技术,这将成为特斯拉在自动驾驶方面的一大亮点。
与此同时,特斯拉 HW 4.0 也有了新的眉目。
据中时新闻网报道,特斯拉正与博通合作研发新款 HW 4.0 自动驾驶芯片,而且明年第四季度就将大规模量产,负责芯片量产的是巨头台积电。
具体信息包括:
芯片由 IC 设计龙头博通与特斯拉共同开发;
芯片将采用台积电 7 nm 工艺制造;
业内首个享受台积电 SoW 封装技术的芯片产品,可以将 HPC 芯片在不需要基板和 PCB 的情况下直接与散热模组整合在单一封装中;
芯片预计 2020 年第四季度开始生产,初期投片规模 2000 片。
回顾特斯拉自动驾驶芯片的时间轴:
HW 1.0 时代(2016 年之前 ),特斯拉主要依靠 Mobileye EyeQ3,传感器配置则为 1 颗前视摄像头+ 1 个毫米波雷达和 12 个超声波雷达。
HW 2.0 时代(2016-2019 年,包括 HW 2.5),特斯拉将合作方换成了英伟达,Drive PX 2 成了这套系统的核心。整个传感器套装则升级为 8 颗摄像头+ 1 个毫米波雷达与 12 个超声波雷达。
也就是在 2016 年,特斯拉开始组建芯片架构研发团队,找来了传奇芯片设计师 Jim Keller 担任 Autopilot 负责人。
2019年,特斯拉成功推出 FSD 芯片:14 nm 工艺,算力 144 Tops,功耗 72 W。
特斯拉 Autopilot 进入 HW 3.0 时代。
那么,这次 HW4.0 的 7 nm 芯片相比 16 nm/14 nm 有什么进步呢?
7 nm 工艺的主要优点是能够在更低的电源电压(低于500mV)下工作,功耗更低(速度提高 35%,功耗降低 65%),发热量更小。
随着自动驾驶系统对于算力的需求日益增长,芯片功耗对效率的影响也会变得越发显著,而7纳米工艺的优势也会更加突显。
有评论称,这颗高性能芯片将用来控制和支撑特斯拉的自动驾驶系统、动力传递和车辆娱乐等功能——打通特斯拉的高性能电动车和自动驾驶两大核心竞争力。
相比HW3.0,特斯拉下一代芯片的性能比 FSD 还要强大 3 倍。鉴于 FSD 的算力已经高达 72 TOPS,HW 4.0 的性能表现绝对值得期待。
说了这么多,打造特斯拉 Autopilot 背后的工程师有多少人?
Musk 答:Autopilot 团队有约 300 名工程师。其中,有 200 名主攻软件,另外 100 人则负责芯片设计。
Musk 还打包票说,软件团队这 200 名工程师随便到哪都能找到好工作,「没有人是他们真正的老板。」
Autopilot 作为特斯拉一等一的大项目,不仅需要 200 名顶级工程师携手合作,还要 100 多名硬件工程师持续输出打基础。
300 人通力合作才造就了 Autopilot 如今这个数一数二的自动驾驶产品。
这也是为什么 Musk 多次强调 Autopilot 会成为这些天才工程师最闪亮的勋章。
除了这 300 名「绝地」工程师,Autopilot 还有其他幕后英雄——超过 500 名熟练的数据标注员。
他们为 AI 算法的提升,提供了源源不断的高价值数据。
需要注意的是,他们并不是廉价劳动力,而是均经过专业训练,甚至能熟练为原始数据打上 4D 标签(增加时间维度)。
100 多名顶级的芯片工程师,近 200 名软件工程师和约 500 位标注员协同工作。对于如此大一个团队,Musk 说道,「我们确实做了相当多的磨合。」
可能有很多人不理解,Musk 在这个过程中的角色。
硬件工程师中,直接向Musk汇报的有:
负责电池和动力系统的 Drew Baglino;
负责车辆架构工程的 Lars Moravy ;
以及负责芯片、计算平台以及弱电系统的Pete Bannon。
软件工程师中,向 Musk 汇报的包括:
负责车辆软件的 David Lau;
操作系统与内部应用的 Nagesh Saldi;
Autopilot 团队整体的负责人 Ashok Elluswamy;
AI 大神 Andrej Karpathy;
负责软件集成与验证的 CJ Moore;
负责 Autopilot 底层代码的 Milan Kovac。
而这些只是 Autopilot 的团队而已,难以想象,整个特斯拉向 Musk 直接汇报的中高层有多少了?
别忘了,Musk 并非凡夫俗子,他还是 SpaceX 的掌舵人,星辰大海可不比 AI 简单。
Autopilot 的成功的背后,不仅要归功于软硬件团队的努力,以及人工智能背后的人工。
最后,还需要一个疯狂的老板。