本文来自微信公众号“车智”(ID:invehc),作者:Michael Yuan,36氪经授权发布。
这是CVPR 2021(2021年计算机视觉和模式识别会议)的“旧闻”,特斯拉人工智能与自动驾驶视觉总监Andrej Karpathy(师从华人AI学者李飞飞),在会议上披露了特斯拉超级计算机Dojo(Dogo:日语直译为道场,意译为训练场)原型机的细节:
使用720个80GB版本的8x A100节点构建的超级计算机,总算力达到了1.8EFLOPS(EFLOPS:每秒千万亿次浮点运算),有10PB的存储空间,读写速度为1.6TBps。上述算力达到了全球第五(取代目前第五的英伟达Selene集群),但尚未正式投入使用。
但上述算力不是特斯拉Dojo的终极目标,在马斯克的规划中,Dojo超级计算机的算力要达到每秒钟exaFLOP的级别,也就是百亿亿次浮点运算,是现在的一万倍,按照2020年全球超算排名,特斯拉Dogo将超过目前的日本超算“富岳”登顶世界超算算力第一的宝座。目前,尚不清楚特斯拉啥时候能够推出来。
特斯拉一直是自动驾驶视觉路线的坚决拥趸,从2021年5月开始,更是把特斯拉量产车上原来标配的毫米波雷达去掉,只采用全车8个摄像头来为特斯拉的FSD(完全无人驾驶)提供外部环境数据采集传感器。这也是目前全球唯一一家采用纯视觉的车企,包括蔚来、小鹏、理想等造车新势力,以及长城、本田、宝马等传统车企,无一例外都是要上激光雷达,以实现辅助驾驶及以上功能。
在特斯拉看来,把毫米波雷达砍掉,是因为多传感器融合,会干扰系统的判断,甚至会造成误判,因为但不同传感器过来的数据冲突的时候,会延长系统处理和判断的时间,甚至会出现误判。这对于高速行驶的自动驾驶(甚至是无人驾驶)汽车来说,是非常可怕的。
早在2019年的特斯拉自动驾驶日,马斯克就对外剧透了特斯拉Dojo的想法,时隔两年之后,特斯拉对外阐述了Dojo的算力和工作方式。在特斯拉看来,要想让机器人司机对新环境的反应可以表现得像人类,甚至是优于人类的话,需要一个巨大的数据集以及处理这些数据集的计算机处理能力。
对特斯拉来说,巨大的数据集来源,就是遍布全球的百万级的特斯拉车辆。目前,特斯拉已经积累了100万个10秒左右的视频,并给60亿个物体贴上了深度、速度和加速度的标签。这些数据每天都还在增加,这就需要特斯拉有一个强大的计算机来处理这些庞大的数据,因为,目前这些数据已经达到了惊人的1.5PB。以特斯拉百万级的车辆保有量,这个规模的数据收集终端,数据增长速度也是惊人的。
在特斯拉的规划中,全球各地的数据,都会汇集到Dojo超级计算机中心进行处理。当然,这不包括中国的数据,因为中国出台了相关的管理办法,限制这类数据出境,因此,特斯拉在上海建立了数据中心,不知道会不会放一台Dojo到上海呢?
对于自动驾驶来说,如此大规模的数据,如何进行标注是个大问题。特斯拉Dojo采用的是无监督学习算法,这个算法是无需人工对训练数据集进行标注,系统自行通过样本间的统计规律对样本集进行分析,从而减少特斯拉对数据进行人工标注的工作量,从而帮助实现训练效率的指数级提升。这是特斯拉的杀手锏。
关于Dojo的更多细节,包括商用时间,在未来几个月内可能会得到披露。有可能是特斯拉财报电话会上,但更大的可能是在特斯拉正在筹划的“AI Day”上。Dojo的出现,显然会帮助特斯拉加速实现完全无人驾驶的商业化,一旦实现完全无人驾驶,特斯拉必然会推出RoboTaxi车队提供打车服务。
特斯拉Dojo的出现,对于其他自动驾驶公司来说,这是一个巨大的挑战。去看看超级计算机的排名,前五的除了第五名的Selene是英伟达的之外,前四的都是国家拥有的,包括第一的日本“富岳”、美国的Summit和Siera分别二三,第四的是中国的“神威太湖”,这些都是举国之力的结果。一旦,特斯拉Dojo登顶第一,这样的算力霸权会让其他公司望尘莫及。
目前,自动驾驶的实现路线中,特斯拉在纯视觉路线上越走越远,其他公司在激光雷达上的路线越走越远。出现这种情况的原因是理念不一样,马斯克认为人类不需要激光雷达来开车,所以,机器人司机也不需要才是合格的。在这样的原则下,特斯拉自研芯片、自研超算,更重要的是搭建和不断迭代算法架构,并且有海量的数据进行训练。
最终,无人驾驶这场战争会不会因为Dojo的出现而终结,整个激光雷达行业会不会最终被覆灭。因为马斯克说,Dojo是对外开放的,和特斯拉此前说公布电动汽车专利是一样的套路,其他公司敢用吗?