目前,自动驾驶技术研发分为两种阵营,一种是Google的无人驾驶车辆,在这个技术路线中,车辆完全由人工智能来驾驶,比如可以将车辆的方向盘、油门和刹车去掉,同时,为了增加技术的可靠性,Google无人驾驶汽车以激光雷达为核心,一个64线的激光雷达成本在7万美元左右,整体解决方案较贵。另一种是以特斯拉、奔驰、沃尔沃等车厂为代表的渐进型自动驾驶,即先从辅助驾驶开始做起,在特定场景、或是特定的封闭结构化路段适用,做出紧急刹车、自适应巡航、车道保持、自动泊车等动作,后续涉入高度自动驾驶,即除了结构化路段外,还能在非结构化道路上自动驾驶。
第二种技术路线的特点是成本较低,主要是算法+毫米波雷达+摄像头的解决方案,传感器承担的精度要求降下来,那么对算法的要求就比较高了。
我近期接触的“图森科技”采用了第二种技术路线,目前正在于北方奔驰和北理工合作开发解放军第三代的运输车辆的自动驾驶系统。目前,图森与一些大型重卡公司达成合作,这可以为物流公司节省成本:将原来两个司机的人工成本降低到一个司机;在车队编制的情况下,后车以无人驾驶的方式跟随头车行驶。
9月19号,图森在自动驾驶算法公开排行榜KITTI和Cityscapes评测数据集上获得第一的名次。其中KITTI由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,是自动驾驶场景下的计算机视觉算法评测数据集,用于评测目标(机动车、非机动车、行人等)检测、目标跟踪、道路分割等计算机视觉技术在车载环境下的性能。KITTI包含市区、乡村和高速公路等场景采集的真实图像数据,每张图像中多达15辆车和30个行人,还有各种程度的遮挡。
而在KITTI中,图森科技在目标检测三个单项、目标追踪两个单项、道路分割四个单项,共计九个单项获得第一名的成绩。接下来分别说下这几个技术要点。
KITTI目标检测:
目标检测指的是把一张图片中所有的测定物体找到并且标注出来,为了分类方便,这项任务将道路参与者分为了汽车、行人和骑自行车的人三种。
KITTI目标追踪:
经过上面的步骤,在检测到目标后,系统会出现一个框将目标框起来,所谓目标追踪就是将不同物体在不同帧之间的相对位置做一个关联。目标追踪和检测的最大区别是强调位置的关联性。图森科技CEO陈默告诉36氪,在目标追踪中图森的一项优势是,每得到一帧图像,马上就能得到一个结果;而在KITTI赛中其他参赛者则会有一些限制,比如要先输入一段视频,得到完整视频后,才能得到帧之间的关联。
KITTI道路分割:
陈默表示这是比检测和追踪更难的任务,这里分成了三个场景,第一个是UM,就是urban marked,即市内有标记线的道路;第二个场景是UMM,就是urban multiple marked,代表的是市内多线的道路场景;最后一个叫UU,就是urban unmarked,即市内没有标记的道路。图森在这三种测试中也都拿到了第一的名次。
至于Cityscapes则是一个比较新的数据集,它的任务是做场景的分割,而不是只分割道路。参赛者需要给全图每一个像素都打上标签,分别属于道路、行人、汽车、天空、建筑物的标签等,共计约有40多类。图森对此也拿到了第一的成绩。
除此之外,图森科技还在驾驶员防疲劳检测上有一定设计,即通过找出人脸上的关键点,包括鼻子、眼角、嘴角等共51个点来定义人脸轮廓,进而通过图森的视线追踪技术来进行疲劳驾驶和分神驾驶的检测。
我是 36 氪汽车记者,欢迎与我切磋讨论。微信 KatherineLWong