编者按:本文来自微信公众号“汽车之心”(ID:Auto-Bit),作者:张竹,编辑:王德芙,36氪经授权发布。
2021 年,Robotaxi 无人车的规模化与自动驾驶技术的前装量产,已经成为汽车科技发展的两个重要主题。
百度在去年底公布其 L4 自动驾驶车队规模达到 500 台。
今年 4 月,百度又对外披露,将在年内再增加 500 台 Robotaxi。
同月,百度的 L4 自动驾驶路测里程突破 1000 万公里。
小马智行目前拥有超过 200 辆车的自动驾驶车队,其自动驾驶测试里程超过 500 万公里。
搭载了大量传感器的自动驾驶汽车,每小时将产生 TB 级甚至到 10 TB 级别的数据。
如果是一支百台车的自动驾驶车队,每天产生的数据就是 PB 级的。
车队规模和测试里程的快速增长,意味着头部公司将迎来数据量的大爆发。
同样的现象,也正在消费级汽车上发生。
比如今年底,预装了华为高阶智能驾驶解决方案的极狐阿尔法 S HI 版车型就将向消费者交付,HI 版车型将搭载 3 颗激光雷达、6 个毫米波雷达和 13 个摄像头。
以及,小鹏汽车不久前推出紧凑型轿车 P5。
P5 会在第四季度搭载两颗激光雷达交付。
2007 DARPA Grand Challenge 参赛车
十几年前,当硅谷的 DARPA 无人车挑战赛举办时,人们一度以为自动驾驶还要半个多世纪才能到来。
但现在看,自动驾驶量产车和自动驾驶出行服务似乎就在眼前了。
对行业内来说,跨入千万公里级的自动驾驶测试里程,以及实现以万台级为单位的自动驾驶汽车前装量产,将带领整个汽车科技行业进入大数据的「无人区」。
千万公里级数据如何传输、存储和挖掘?
目前在全球范围内,L4 自动驾驶测试里程积累最多的公司是 Waymo。
Waymo 的前身是 Google X 下的无人车项目。
Waymo 用了将近 8 年时间完成了第一个 1000 万英里里程的积累,而第二个 1000 万英里积累用时仅 1 年零 3 个月。
这说明,随着车队规模增长和大范围测试开展,自动驾驶里程的增速将越来越快。
虽然目前全球完成千万公里级里程积累的自动驾驶公司只有 Waymo 和百度两家,但相信在今年和明年,会有越来越多的公司加入这一行列。
毫无疑问,数据是自动驾驶发展的金矿。
而面对如此大规模的数据,如何传输、存储和挖掘已经成为业内面对的新兴问题。
以往在自动驾驶算法训练的过程中,针对大容量车载数据的离线迁移,目前业界没有特别成熟的解决方案。
常见的做法是将车载计算平台中的固态硬盘取出来,再通过快递或人工手段,从训练场带到数据中心。」希捷科技中国区业务拓展经理董志南向我们分享。
「这样的做法可能传输效率比较低,运输过程容易损伤盘体造成数据丢失,不利于自动驾驶系统的快速开发迭代。」
为此,希捷在过去几年开发了一个 Lyve 系列的产品,这是一套「套娃式」的模块化存储硬件,从车载端覆盖到服务器端,来实现庞大数据量的转移和传输。
目前,丰田的自动驾驶子公司 TRI-AD 和捷豹路虎在爱尔兰的研发中心都在使用 Lyve DRIVE 进行自动驾驶系统的快速转移和存储。
解决了转移和存储问题,下一步是如何从海量数据中挖掘出最有价值的数据。
「如果行驶场景是空无一人的大街,其实对算法训练没什么帮助。」希捷科技的董志南分享,「真正有价值的是一些非常少见的交通状况,比如红绿灯突然坏掉了,于是路口变成了由一个交警来进行指挥的场景。」
百度 Apollo 自动驾驶技术部总经理王云鹏将海量数据的数据挖掘工作总结为人工标注 - 离线挖掘- 在线挖掘三个阶段:
第一个阶段,通过车上的测试人员来记录问题,从而标记下那些出现问题的场景数据;
第二个阶段是离线挖掘,也就是数据回传到数据中心后,通过动态场景语义理解,给数据打上自动化的标签,在导入仿真场景库中进行大量的训练;
第三个阶段是在线挖掘,车端的系统通过动态条件出发,来主动采集和回传高价值的场景数据,从而减少大量数据存储和转移的工作。
通过这样的过程,车队开展规模化的路测,路测数据被快速传回数据中心,有价值的数据被挖掘出来,加速自动驾驶系统的高效迭代。
一方面 L4 级的自动驾驶技术快速发展,最激进的公司可能希望在 5 年之内推动 Robotaxi 民用化。
另一方面,L2+的技术开始大规模上车。
特斯拉具有高速公路上下匝道、自动变道功能的 NOA 自动导航辅助驾驶就是典型的 L2+系统,蔚来汽车在 2020 年也推出类似的 NOP 功能,小鹏在 2021 年初推出 NGP。
此外,长城汽车、吉利汽车、理想汽车均有推出此类功能的计划。
在此基础上,华为更进一步,华为联合北汽极狐将在今年底交付的车型上,实现城市道路自动驾驶的高阶智能驾驶方案 ADS。
小鹏在 P5 上推出的 Xpilot 3.5 城市 NGP 功能也是类似方案。
华为联合北汽极狐的量产车阿尔法 S HI 版,搭载 3 颗激光雷达
这些自动驾驶系统的推出,改变了车辆上的传感器、计算平台部署以及电子电气架构设计,也大幅改变了汽车的软硬件成本结构。
同时,因为机器参与了车辆的驾驶过程,针对这些车辆的驾驶责任界定也正在发生变化。
过去,车辆交通事故的驾驶定责只需要行车记录仪就可以,而现在每辆智能汽车上都需要一个「黑匣子」。
比如,在近两年中,关注度极高的各类特斯拉的事故,就是通过黑匣子来还原众多的车辆数据,包括事故当时 Autopilot 是否开启、驾驶员是否手握方向盘、驾驶位的安全带是否系紧、事故发生前刹车/电门的状态等等。
针对高级别自动驾驶的车辆,黑匣子记录的数据更为复杂。
比如,在 AutoX 的黑匣中,监控范围包含车辆底盘、计算单元及复杂的系统层面信号、传感器及全部感知到的周围环境路况、到自动驾驶全栈软件所有模块信息。
虽然当前各大车企对于车载黑匣子的具体规格还未达成一致,但董志南告诉我们,「自动驾驶系统上路的所有数据,包括激光雷达、摄像头、毫米波雷达数据都将被记录下来。」
「在未来的量产车上,车规级、大容量、高性能的存储硬件也将是标配。」
一方面,这些存储硬件可以还原车辆驾驶时的一些关键状态。
另一方面,它们记录下车辆在路上经历的复杂场景,这些场景数据可以用于加速自动驾驶系统的迭代。
随着这些自动驾驶车辆大规模量产上路,不仅车端的软硬件系统发生变化,同时车企与技术公司也将为车队在各地建立起大规模的数据中心。
AutoX 在上海嘉定的超级数据工厂
IDC 的报告显示,全球的数据,每 3 年就会暴增一倍。
2019 年,全球的数据总量是 40ZB。
预计到 2022 年,这一规模将增至 80ZB。
而到 2025 年这个数字将是175ZB。
汽车的智能化,将大幅加快大数据爆炸性增长。
谁能最有效地利用数据,谁就能挖掘到智能时代最大的金矿。