大数据文摘记者 魏子敏 刘涵
计算能力、大数据,以及算法,这三部分哪个是人工智能相关应用领域的最强的壁垒?
百度自动驾驶事业部总监孙勇义用这样一个问题开启了在清华x-lab人工智能研习社的第二讲。这是一个在AI应用中的常见问题,“数据”和“算法”的支持者们各有论据,而在自动驾驶这样一个更具体的场景下,孙勇义显然更看重前者。在讲座前的专访中他也告知大数据文摘记者,百度在7月初发布的Apollo计划也正是百度获取更多数据、创立数据生态的另一个落地入口:一方面可以收集到更多自动驾驶相关数据,辅助相关算法提升;另一方面,通过Dueros这一车载环境下的语音交互入口,获取更多自然语言数据,提升相关技术。
百度自动驾驶事业部总监孙勇义在现场做了题为《Apollo计划背后的人工智能技术》的演讲 图 | 刘涵
孙勇义在演讲中进一步说,“Apollo开放的初衷是,开放算法和能力,获得的是用来做自动驾驶算法训练的数据。”
相比智能音箱等已经进入消费级市场的产品,依然处于研发阶段的自动驾驶显然在获取用户数据上更加艰难。孙勇义称,最理想的数据采集方式还是的自动驾驶车上市后在路上跑采集大量数据,比如特斯拉,每一辆卖出上路的特斯拉都是一个数据搜集者,可以帮助特斯拉进行数据研发。百度自动驾驶目前的几种主要方式是:和汽车厂商合作,利用数据采集车、实验车,以及跟第三方运营车队合作采集数据。
“人工智能技术是锤子,行业问题是钉子,ai技术有行业通用性,但是落地时候需要跟行业绑在一起。”孙勇义对于ai人才的要求也基于此,“ai人才需要去找行业落地场景,打造数据闭环。”
以下为孙勇义演讲精华整理,在不改变原意的情况下有部分删改:
首先,我们从汽车行业的趋势开始讲起。汽车行业有三大趋势:第一是电动化,我们已经在北京感受到了,由于政府的限号与新能源的开发等原因,未来我们将会在大街上看到更多的新能源车;第二是共享化,随着滴滴、Uber的发展我们明显感受到共享出行是未来发展的趋势。第三是智能化,智能化包含了车的自动驾驶、以及车内的智能人机交互等,未来在智能化领域这是一个万亿级的市场。
在未来,一个汽车的价值主要来自于其软件。如同过去手机的功能机时代,当别人问我们用的是什么手机的时候,我们的第一反应是在问我用什么牌子的手机,是诺基亚还是西门子。而到了智能机时代,大家如果问我用的是什么手机,我们的第一反应是iPhone iOS还是安卓。我们的第一反应不再是手机品牌,而是手机系统、手机软件是什么。
在未来,人们开始用软件定义汽车。在整个汽车驾驶里面,能达到60%的驾驶都来自于软件,大家换车如同换手机一样,新迭代出一款智能车大家就换一辆新的出来。
在人工智能技术发展的历史中,经历了很多高潮、低谷。在50年代就已经有人提出了人工智能这个词,人工智能技术已经不是特别新鲜的名词了。
但是,由于当时技术并不成熟,人们只是有了这个概念,这股浪潮起来一波之后,人们发现实现人工智能技术还很远,人工智能开始进入第一个冬天。当计算能力变强之后,人工智能的第二波春天来了,但人们发现,想要实现人工智能依然很难,第二波冬天随之而来。一直到90年代开始,当机器学习、深度学习渐渐兴起,特别是像百度、Google、Facebook等互联网公司的大力投入,人工智能快速发展。当人们质疑未来是否还会再来一波冬天,我们的数据和计算能力、以及我们当前已经落地的应用告诉我们:人工智能的时代真正的到来了。
对于人工智能技术,主要是三个部分构成其必要的条件:第一是海量的计算能力;第二是采集的数据;第三是人工智能算法。如果想要在人工智能的领域里面建立整个行业壁垒,最重要的是数据。有一位专家曾经说过:数据秒杀一切算法。Apollo开放算法和能力的目的就是获得用来做自动驾驶算法训练的数据。
从智能汽车的算法研发角度来看,我们的一个研发闭环是我们的车在道路上跑,会碰到很多场景,有一些会处理的非常好,有一些则相对于差一些,它会选择性的把这些处理不好的场景传输到云端平台,云端平台会对这些处理不好的场景进行训练,训练之后会生成一个新的算法下发到车里。随着车在路上跑的里程越来越多,数据也随之越来越多,我们的车子也会变得越来越智能。
下面做一个小调查,计算能力、大数据和算法,这三部分哪个是我们某一个人工智能领域的最强的壁垒?其实算法的保密性不是特别高,如果说这个团队研发很牛的算法,他可能会发表一篇论文,把算法讲一讲。也有可能其他公司会把团队核心的一些骨干人员挖一挖,他也知道这个公司的算法是怎么做的,所以说其实在整个的AI领域里来讲,比如说在一些标准的公开测试集上面,发现第一名和第二名的差距没有那么大。要建立整个行业壁垒,其实最重要的是什么呢?是数据。Apollo开放的目的是什么?开放的是算法和能力,获得的是用来做自动驾驶算法训练的数据。
讲座后,清华学生向孙勇义提问 图 | 刘涵
作为一个智能汽车的算法研发来讲,我们的一个研发闭环是,我们的车在道路中跑,它会碰到很多场景,有些能处理的很好,有些处理不好。它会选择性的把这些处理不好的场景传输到云端平台,云端平台会对这些处理不好的场景进行训练,训练完了之后生成一个新的算法,下发到车里。
对自动驾驶车来说,有可能算法本身并没有做什么特别大的改变,但随着车在路上跑的里程越来越多,遇到的错误场景就越多,根据这些场景进行训练自动驾驶算法就能得到提升。所以在算法不变的情况下,随着积累的数据越来越多,我们的车也会变的越来越智能。
再介绍一下自动驾驶技术的十大技术。分成两大类,第一大类是底层的工程类的偏支撑性的技术,包括硬件、车载系统、人机交互、智能互联以及系统安全。再上面这五大部分就是汽车大脑、环境感知、地图定位、行为预测和规划控制。
我再对技术做一个深度的剖析,第一个是感知技术,对自动驾驶来讲,最重要的就是环境感知的能力,他要知道周围有哪些人,有哪些车,它们运动的速度、轨迹各是什么样的。右侧的小视频是基于摄像头一个障碍物的识别,左侧是我们在测试集上面,当然这个数据是相对陈旧一些,因为现在有更多的提升,百度在这个领域还是属于遥遥领先的。这是基于摄像头的感知技术。但是基于摄像头的感知技术存在一些,它的优点一个摄像头确实是比较便宜,一个摄像头硬件成本几十块钱就可以了,但是它的问题就在于当光线非常不好的情况下,或者说刚进入隧道的情况下,它的识别就不太好。另外像摄像头识别准确率还有待提升。
为什么自动驾驶需要高精度地图?首先,高精度地图可以帮助我们做高精度定位。高精地图的误差一般在10厘米之内,所以无人车可以根据地图的一些自身定位技术知道自己在哪个车道线里面,以及离前方路口还有多远。第二,可以帮助我们做环境感知。不仅仅是可以识别红绿灯,需要用到环境感知的地方还有很多。比如前方有减速带,车必须提前减速,但识别减速带的话是一个很大的工作量。但更简单的方式是在地图里面标出来,使得智能车在很远的地方就知道前方有减速带、斑马线、禁止停车区等,从而可以提前做一些判断措施,不需要再去特意地识别。第三是帮助做导航决策规划,从而帮助做云端仿真。
同时,高精度地图还能够帮助我们解决一些复杂路口的难题。比如在五道口复杂、行人多的地方,如何让车在路口拐弯的时候能够像人一样拐出来,都需要依靠地图的帮助实现。
做自动驾驶有一个很重要的原则,那就是:能够提前预处理的问题提前处理好,让车的判断越少、也就越安全。
今年在7月5日对外正式发布了Apollo,通过整个Apollo计划,我们已经跟业界创业公司、车企都进行非常好的合作关系,我们开放的Apollo代码是一套完整的,非常安全的能够实现全自动驾驶功能的代码。整个Apollo开放的Roadmap,今年7月份是首次开放Apollo1.0,它实现的是在一个封闭场地自动驾驶的功能,是一个提前可以把车辆行车轨迹做好了,车可以完整的回放这个轨迹。云端开放数据共享平台,能够实现数据共享。
今年9月份开放了定车道的跟车功能,以及仿真平台。在今年的12月份,我们会准备开放简单城市道路的自动驾驶功能,一直到2020年12月份,会开放高速和城市道路的全自动驾驶功能。
整个Apollo的一个全架构图分四层,最下面一层是车辆平台,因为所有的自动驾驶车必须是线控车。普通的车是通过方向盘人来控制的,机械控制的。什么是线控车呢?得通过指令让方向盘自己转,自己踩油门,踩刹车,所以自动驾驶必须得能够通过线控指令来完成油门、刹车、方向盘。上面一层是硬件平台,硬件平台也是一个推荐的硬件列表,包括摄像头、雷达等等。再上面是软件的平台,开放代码的核心部分。再上面一层是云端平台,蓝色部分是1.0开放的,合作伙伴用Apollo1.0之后如何让3天时间让一辆车变成一个无人车。我们的合作伙伴用的Apollo开源的代码,只用了3天时间就完成了一辆车从硬件安装到软件集成到最后调试整个全过程,这也证明了我们的Apollo代码是非常易用的。
今年的12月份我们会开放2.0,我们的模块部分都已经完成开放,但是这个模块能力我们还需要去继续提升。