编者按:本文来自微信公号“青亭网(ID:qingtinwang)”,作者:任然、hi188,36氪经授权发布。
如何让自动驾驶汽车做的比人类驾驶员还要好?这在几年前听起来貌似是不可能的事情,因此人类驾驶员比汽车知道更多的东西,人类不仅能驾驭汽车,还能清楚的了解各种路况信息以及人的驾驶行为等。对于汽车来讲,想要达到接近于人类驾驶员的水平,就必须要收集到大量的驾驶数据。
目前,拥有最多驾驶数据的两家公司就是Tesla特斯拉和Waymo。
特斯拉和Waymo都试图收集和处理大量的数据,用于研发自动驾驶技术。不过,这两家公司的处理方式却不相同。特斯拉通过目前现有的几十万辆车收集真实世界的车辆数据,包括它们的执行方式,因为其当前已经达到了半自动驾驶的能力。而Waymo源自于谷歌的自动驾驶项目,它使用了强大的计算机模拟系统,并从那些少量的真实车辆中去学习实践。
每当一个新事物诞生,总会有人持不同意见。自动驾驶的支持者声称,自动驾驶技术将能够减少意外车祸导致的死亡人数。要知道,在美国每年竟有4万多人因意外车祸丧生,在中国这一数字要更高。
Intel认为,到2030年自动驾驶汽车每年销售额将达到8000亿美元,到2050年,每年销售额可达7万亿美元。去年,摩根士丹利分析师亚当·乔纳斯指出,“数据”比特斯拉本身更具有价值,只有足够多的自动驾驶里程、数据、以及更多的自动驾驶数据才足以支撑特斯拉股票的增长。
当前,特斯拉正在通过所有客户(现有几十万辆)的车辆来收集自动驾驶数据,这些客户几乎遍布全球,而且Autopilot半自动驾驶的使用率颇高,特斯拉正是通过它的隐私政策来收集这些信息。
不过,我们依然难以确定特斯拉通过Autopilot来收集到的里程数,因为特斯拉目前尚未公开声明。根据IEEE Spentrum在2016年的数据,当时任职Autopilot的负责人表示,特斯拉已经收集了7.8亿英里(约12.5亿公里)的数据,其中1亿英里(约1.6亿公里)数据来自Autopilot。而同年晚些时候,马斯克表示特斯来每天收集到的数据超过300万英里(约482万公里)。去年7月,其收集到总里程数超过50亿英里(约80.4公里),并且随着特斯拉新车不断售出,其收集到的数据里程也会呈现指数型增长。
这里需要注意的是,并非所有里程数据都来自Autopilot,Autopilot仍然只拥有半自动驾驶的能力,不少人将其称之为“L 2.5”级别自动驾驶。不过即便如此,特斯来也会在未开启Autopilot时收集如何处理不同场景的数据,这些数据都会回传至特斯拉的数据库,这些数据可以被用于更好的研究自动驾驶技术。
另一家拥有类似数据的公司是Waymo,该公司在今年2月底宣布它们已经模拟50亿英里(约80.4公里)自动驾驶里程。同时也指出,其自动驾驶汽车已经在公共道路上进行了500万英里的路测(约804万公里),这笔其它所有公司测试自动驾驶的里程数总和还要多。
Waymo受到限制的是,它只通过约500-600辆左右的微型面包车队收集真实世界的物理数据。特斯拉在全球范围内拥有超过30万辆汽车,这些汽车收集到的真实环境远比Waymo的更多样、更复杂,而Waymo目前尽在美国少数几个州展开测试。因此,即便特斯拉Autopilot属于半自动驾驶,但其测试的物理环境要更具应用价值和学习价值。
当然,Waymo正在着手改善这一问题,其计划在今年年底之前增加数千辆克莱斯勒小型汽车。近期,又和捷豹路虎合作,准备推出全电动I-Pace SUV的全自动驾驶车型。Waymo表示,未来几年该公司自动驾驶车队增加值2万辆,这些汽车一旦上路测试,每天将能处理100万次出行的数据。
在此之前,Waymo依然在高度依赖于谷歌强大的模拟系统,这里面遇到的问题就是计算机模拟并不能模拟出真实的路况和情景,因为现实的路况每天都会不一样。这也是为什么特斯拉在现实世界中更为领先的原因。投资分析师塔莎·基尼说“我相信大家都同意Waymo的技术是目前最好的,但我认为很多人低估了特斯拉的数据收集的潜在力量”。
这两家公司在收集数据的类型和规模方面显然是不同的,现阶段Waymo的自动驾驶汽车共使用三种不同类型的Lidar激光雷达,5个雷达和8个摄像头,特斯拉汽车业基本装备8个摄像头、12个超声波传感器和1个前置雷达。
相信大家也都熟悉,特斯拉并没有在其自动驾驶汽车中采用Lidar激光雷达,虽然其和雷达很像,但它并不通过无线电波工作,而是通过每秒发出数百万个激光信号,以及收集它们返回传感器的时间,以此来测量距离。这样就可以创建出超高分辨率的汽车周围环境图像,各个方向都可以测量到,前提是找到一个合适的位置,例如车顶。
由于激光雷达自带光源,因此其在晚上等黑暗场景下也可以保持较高的精度,这一点很重要,因为相机目前在弱光环境下效果会变差,而雷达和超声波也不及Lidar激光雷达精准。
行业内多数认为激光雷达是自动驾驶必要的条件,但马斯克不这么认为。
但是,激光雷达既昂贵、体积又大,而且其工作还有一个物理转动的零件(目前都是这样),把这样出一套装置放置在汽车上也会带来一些问题,例如整车成本、外观美观性等。马斯克则表示,激光雷达虽然很不错,且能在现阶段让自动驾驶变得更容易,但特斯拉并不会采用这套系统,反而是通过基于摄像头的系统来降低整车成本。
如果特斯拉可以在没有这种技术的情况下开发自动驾驶汽车,那么这样是一个巨大的优势。这是一个风险更高的策略,最终效果也许会不错。如果特斯拉能推出没有Lidar激光雷达的自动驾驶汽车,那么那些主导Lidar的厂商或将遭到重大打击。
当前,这还是一个长期的猜测。根据通用汽车的自动驾驶演技实验室的主任Raj Rajkumar的说法,如果不采用激光雷达的数据,特斯拉会让自己走的很难堪,并处于劣势地位。(卡内基梅隆大学是一所因机器人技术而闻名的学校,Uber曾在2015年挖走了数十名研究员。)
激光雷达被很多业内人士视为自动驾驶汽车的必备工具,Rajkumar对特斯拉的自动驾驶技术(通过摄像头来收集环境数据的方式)持怀疑态度,并说到,我认为特斯拉的硬件可能做不到完全自动驾驶。
目前,还不清楚特斯拉收集的数据包括哪些,根据其隐私政策现实,特斯拉有权获取有关汽车的加速、加速度、刹车、电池使用的数据,并可以在事故发生期间记录短视频。这些数据可以远程收集或者在到4S店服务的期间完成。值得注意的是,特斯拉隐私政策规定,只有特斯拉可以访问“关于使用和操作的信息”。
同时,特斯拉也拒绝回复每个传感器收集的数据类型,或者数量的体机等信息。Rajkumar讲到,这些数据可以是一段视频或超声波数据等形式,但还不清楚特斯拉收集到的视频是高保真清晰度还是经过压缩处理的低码率视频。
Keeney也认同这个观点,并表示:“Waymo的数据集更详细,因为他们使用的是激光雷达,它比相机中获得的信息多得多。”
收集数据是一回事,但就连马斯克也指出,处理数据也是一项艰巨的任务,因为数据量实在太大了。
相比之下,Waymo对它的模拟似乎更有信心。据《大西洋月刊》去年夏天发布的一份报告称,Waymo重新设计了其测试城市的全电脑模型,并且每天在这些虚拟城市中测试2.5万辆“虚拟自动驾驶汽车”。
通过在计算机上建立真实的驾驶数据模型,可以运行数千种不同的场景,这有助于Waymo构建紧密的反馈循环,而这些测试数据随后将被下载到测试车中。Waymo还在加州建立了一个专门的测试环境,在那里建立特定的街道特征或其它场景,可以给测试车辆模拟各种复杂的路况。
Rajkumar说,这个项目耗费了令人难以置信的投资、资源、时间和努力为代价的,这得益于母公司为Waymo提供了强力的支持,他认为特斯拉很难做到这一点。“特斯拉将不得不在这方面投入更多,并且要经历一个高度劳动密集型的过程。”
马斯克在两年前表示,自动驾驶技术要获得真正的“全球监管批准”,需要大约60亿英里的测试里程。实际上特斯拉很可能已经超过了这一目标,但它的汽车仍然无法实现完全自动驾驶。原定于在2017年进行的从洛杉矶到纽约的自动驾驶旅行计划已被推迟,自动驾驶系统的仍在不断改进中。
与此同时,Waymo正在以前所未有的速度积累着测试里程,目前也已接近60亿英里这一大关,并且依然有数千辆汽车在等待测试。Waymo计划在今年晚些时候推出使用无人驾驶汽车的商业叫车服务项目,该项目已经在亚利桑那州试行,这将进一步为其数据反馈循环提供支持。
特斯拉和Waymo是这一领域最为领先的两家公司,但这一领域并不是只有这两家公司表现突出,最引人注目的竞争对手就是:Uber。与特斯拉和Waymo相比,Uber采用了一种更随意的方式进行自动驾驶测试,这也是以“除旧立新,快速突破”为座右铭的硅谷公司的典型特征。
2016年在匹兹堡开始测试后,Uber在旧金山的街道上投放了早期版本的半自动化沃尔沃汽车,但没有获得必要的国家许可,之后他们将测试转移到了亚利桑那州。Uber最终同意了加州的基本要求,但它与国会议员们的妥协,让这家公司落后于Waymo等竞争对手。
在三个州建立了测试车队之后,Uber很快便开始积累测试里程。据《纽约时报》报道,截至2017年11月,它已在全国范围内行驶了200万英里。目前尚不清楚Uber的测试里程总量,而今年3月它的一辆测试车在在亚利桑那州撞死了一名行人,这使其技术水平也开始受到人们质疑。
Keeney说,在自动驾驶汽车领域,唯一与Waymo或特斯拉技术水平相当的公司,是一家老牌汽车公司:通用汽车。在收购了一家名为克鲁斯自动化的公司后,通用汽车一直在其帮助下研发Bolt自动驾驶电动汽车,并且计划在2019年试用商用自动驾驶服务。
通用汽车正在效仿Waymo的做法,通过生成和处理自动驾驶数据来训练汽车的驾驶能力。但通用汽车的优势在于其生产能力,Waymo和捷豹虽然达成了协议,将来也能发展成新产品,但实际上它们并没有自己生产这些汽车。Keeney认为,一套垂直策略对公司发展是非常有好处的。
与特斯拉一样,通用汽车也有半自动化汽车产品在售,但这种名为“超级巡航”的产品仅应用于一款凯迪拉克车型,也没有很快扩散到其他车型上的迹象。在Keeney的眼中,这是通用汽车以及其他所有汽车制造商错失的又一次机遇:“为什么不像特斯拉一样,为在售的所有车型装上传感器来收集数据?”
在自动驾驶领域还有一匹黑马:NVIDIA,它可能不像特斯拉和Waymo一样拥有动辄数十亿英里的测试里程,但在自动驾驶领域却有数以百计的公司正在使用它的技术。从上个月开始,NVIDIA向其他自动驾驶公司销售一种被称为“Drive Constellation”的产品,而这实际上就是一套现成的自动驾驶模拟设备。换句话说,这是NVIDIA在验证自家的商业化自动驾驶技术。
NVIDIA自动驾驶部门的高级总监Danny Shapiro曾表示,获得良好的仿真对开发自动驾驶汽车至关重要。工程师们必须研究所谓的“角落案例”,或者是不经常发生的情况。在现实世界中,虽然积累足够多的测试里程后肯定会遇到闯红灯、路怒症、恶劣天气等情况,但发生的频次太低,也没有足够的时间来学习如何处理它们。
NVIDIA Drive Constellation系统
“在模拟环境下,我们可以每天24小时不间断的模拟这些场景”,Danny Shapiro说,“这就是为什么任何公司都要首先模拟自动行驶里程。”通过降低进入门槛,NVIDIA让那些没有特斯拉和Waymo那样庞大车队规模或财力支持的公司更容易进入这个领域。更重要的是,NVIDIA作为自动驾驶技术的供应商,可能有助于为自动驾驶模拟建立一个事实上的行业标准。
非营利研究机构兰德公司的高级信息科学家Nidhi Kalra认为,由于目前很难评估私人公司自动驾驶模拟的质量水平,所以制定自动驾驶模拟的标准对于自动驾驶技术的发展至关重要。
“任何模拟器都是对现实世界的简化,”Nidhi Kalra说,“如果模拟的只是山景城中的一条死路,就算你测试了10亿英里又有什么价值呢?我不是说大家都在这样做,但如果没有明确的模拟标准,我们就无法明确这些测试里程的意义。”
Nidhi Kalra为兰德公司撰写了一系列关于自动驾驶技术的研究报告,其中包括2016年的一项研究,试图确定在现实世界中需要多少测试里程才能证明自动驾驶汽车比人类安全。而Nidhi Kalra与报告的合著者Susan M. Paddock得出的结论是,自动驾驶汽车将需要“数亿英里甚至数千亿英里”的里程,才能从统计学角度获得可靠的安全声明。因此他们在报告中称,还需要找到其他方法来证明安全性和可靠性。
Nidhi Kalra认为,模拟测试可以达到这个目的,但需要对测试环境做出更多且更明确的要求。
当自动驾驶汽车公司向监管机构或客户证明他们已经开发出全自动无人驾驶技术的时候,最可能的衡量标准是它是否和人类驾驶一样安全,也就是每X英里的撞车率,每X英里的伤害率,甚至每X英里的死亡率。
正如Nidhi Kalra和Susan M. Paddock在研究中指出的那样,现实世界中很难证明这一点,而在彻底了解模拟测试的质量之前,模拟测试也无法证明这一点。“这很矛盾,” Nidhi Kalra说道,“在人们真正部署自动驾驶技术之前,可能会一直无法证明它的安全性。也许只有在自动驾驶汽车投入使用后,才能有确凿的证据证明它有多安全。”