李升波:智能汽车的核心技术和未来之路
2020-10-22 15:42
字体大小 A- A+
收藏

2016年4月23日,在由最靠谱的汽车牛人平台---牛车网和新势汽车自媒体、车记思维、汽车智能联合举办的2016(首届)汽车智能沙龙论坛中,清华大学汽车工程系副教授李升波博士介绍了智能汽车的核心技术和未来之路。

李升波(清华大学汽车工程系副教授、智能交通学者):各位媒体的朋友,各位牛车网的同仁们,还有我们的海兰女士,非常感谢你们的邀请,我很荣幸参加今天这个沙龙活动。坦白讲,我并不是什么专家,也不是权威,只是进入智能汽车领域早一点,做了一些研发工作,了解一些技术性的内容。今天非常高兴借这个机会与各位来分享我在智能汽车方面的一些体会和心得。部分内容稍微偏技术一点,我会使用尽量通俗的语言为大家解释。

0

我今天的题目是“智能汽车的核心技术和未来之路”。为什么特别想与大家分享一下核心技术呢?我想,整个智能汽车发展趋势,在座的诸位已经特别熟悉了,媒体应该比我更擅长去解读。但是,就像刚才海兰讲到,智能汽车的发展过程产生了很多嘈杂的声音,不少人谈智能汽车,讲智能汽车,甚至要做智能汽车,但是对智能汽车的理解不够细致,也不够深入,所以就想希望借此机会,抛砖引玉,把智能汽车的体系、构架和核心技术与大家梳理一遍。

0

谈智能汽车之前,先从道路交通说起。对于我国的汽车行业,2020年应该是一个坎。按照《国家道路交通安全科技行动计划》,我国希望2020年万车死亡率接近中等发达国家的水平,乘用车的油耗达到百公里5升,汽车的污染物排放量减少30%到80%。大家都在开车,对一般轿车的油耗也比较了解。以内燃机为动力的轿车油耗大概是7到8升,稍微费油一点的车在10升左右。另外,从2011年的各国万车死亡率数据,大家可以看到,中国大概是美国的6倍,是德国的10倍,是日本13倍。可想而知,我们要达到2020这个目标是多么困难。

0

为达到这一目标,尤其是安全目标,道路交通的“人、车、路”三者中,人是最值得分析和关注的要素。什么原因呢?人的长期进化,使得我们眼睛、大脑以及手脚特别适合步行和跑步的速度,不适应高速运动的汽车,这是导致驾驶员能力薄弱的重要原因。国内外大量研究表明:大约80%至90%的交通事故是驾驶员的因素导致的。汽车的智能化是解决驾驶员薄弱性的一个必由之路。进入智能化时代,由于大量传感技术、通信技术的引入,具备了感知环境状态、驾驶员状态和车辆自身状态的能力,并能够进一步通过自动化技术控制车辆行驶,实现人、车、路的统一协调,为最终解决汽车时代的各类问题带来了曙光。

0

什么是智能汽车呢?最一般的理解是智能汽车就是无人驾驶。这里提一个比较直观的定义:“智能汽车是具有环境认知、自主决策和自动控制能力的汽车”。人开车的时候,通过眼睛、耳朵和身体感知环境与汽车的状态,通过大脑进行判断当前路况,决策如何行使,最后通过手、脚控制汽车前进或转弯。智能汽车将代替人的感知、决策和操控功能,采用先进的传感、决策和控制技术,判断“汽车到底处于一种什么样的环境?”,决策“要超车还是要变道呢?”,最终实现“方向盘、刹车和油门的自动控制”。

0

目前,国际上最耳熟能详的智能汽车是谷歌的无人驾驶汽车。2012年谷歌智能汽车获得了首例的驾驶牌照,2013年测试行程达到了30万公里。谷歌的无人汽车具备优良的环境感知、判断决策和自动控制能力。

0

实际上,智能汽车这个概念本身是十分广义的,不仅仅局限于无人驾驶汽车。目前最流行的分类体系是美国NHTSA(美国高速公路安全管理局)的定义,很多整车企业的发展路线图也是采用这个体系。按照NHTSA的定义,将汽车按照智能化水平的高低分为五级。驾驶员手动驾驶的汽车完全没有智能水平,属于第0级。之后按照智能化水平从低到高,分为1级到4级,分别是驾驶辅助型智能汽车,半自动化的智能汽车,高度自动化的智能汽车,完全自动化的智能汽车。

驾驶辅助型智能汽车是能够某个单一方向实现一定自动感知或决策功能的汽车。比如说车道偏离预警系统等,属于这一级别的智能汽车。这一级别的智能汽车,主要功能是采用一定的传感器来代替人类的感知,当危险情况发生时,给驾驶员一个预警的信号。下面讲讲半自动化的智能汽车。半自动化是指纵向(前进方向)或横向(转弯方向)具有一定的自动行驶功能。比如说,自适应巡航控制(ACC)系统属于纵向的自动行驶,车道保持(LKS)系统属于横向的自动行驶。现在最常说的无人驾驶汽车(如Google无人车),实际上属于高度自动化的智能汽车。这种汽车具备结构化的道路上自动行驶的能力,包括纵向和横向。什么是结构化道路呢?标识和路况比较规则的城市道路和城际道路,比如说北京的四环路、五环路,北京到天津的高速公路。完全自动化汽车是智能汽车的最高级别。理论上说,它具备完全取代人的驾驶能力,甚至超过最好驾驶员的水平。但是到目前为止,没有任何无人驾驶汽车做到这一点,这一级别是我们的理想和目标。

0

智能汽车的产业化是大家关心的一个问题。实际上第1/2级别的智能汽车已实现产业化,大家主要关心第3级别的产业化进程。我大致总结了国内高度自动化汽车的产业化时间点。谷歌计划在2018年将无人驾驶系统推向市场。其他公司如通用、宝马、尼桑也计划在2020年将无人驾驶功能推向市场。据我了解,几乎所有的IT行业和汽车行业都计划在2020年到2025年间,将刚才所说的,类似谷歌无人驾驶汽车的功能推向市场,这应该是第3级智能汽车真正起步的时间点。根据美国IEEE的预测,到2040年无人驾驶汽车的市场占有率将达到75%左右,这将极大颠覆现有的道路交通模式。

0

0

0

目前,主要的汽车行业还有IT行业,他们制定智能汽车发展脉络的时候,基本上都借鉴了刚才所说的四级智能化体系。这是沃尔沃是四级的发展路线,这是德国大陆公司的四级发展路线,这是德国博世公司的四级发展路线。

0

为什么汽车能够实现无人驾驶功能呢?这涉及无人驾驶汽车的系统构架与关键技术。从无人驾驶功能的总体思路来说,主要是通过传感器、控制器和执行器来代替人的环境感知、人的判断决策和人的驾驶操作。这一过程,尤其是环境感知和判断决策领域,大量使用了我们耳熟能详的先进技术,例如:信息融合、机器学习、人工智能、路径搜索、自动控制等,这就是为什么这些领域非常热门的原因。这也是百度请斯坦福大学的吴恩达教授作为他们的首席科学家的原因之一。

0

如果说我们深入智能汽车的内部,大致分为下列模块:传感器系统包括各个子传感器硬件,以及每个传感器的特征感知算法,之后将利用信息融合技术实现各个传感器输出的优化综合,达到可靠性最高的环境感知。SLAM(SimultaneousLocalizationandMapping),即时定位与地图构建是传感系统的一个核心技术,它依托街景地图中各个标志物的特征位置,依靠传感器融合信息反向推导当前车辆的位置,不仅是位置传感器(如GPS)失效的重要补充,也是城市拥堵工况或非结构化道路工况下不可替代的感知技术。常见的传感器包括摄像头、毫米波雷达、激光雷达、GPS导航、惯性导航和超声波雷达等。另外,各类无线传输技术,如DSRC,4G-LTE等有时也用于智能车辆的信息传递。控制系统部分主要分为路径导航层、任务决策层、轨迹规划层和动力学控制层等模块。导航给出从起点到终点的全局路径,比如从清华大学到天安门具体走什么路。任务决策是指到了某一条道路上,具体走那一条车道,具体执行什么任务,例如:超车、换道、直行、跟车等,或十字路口之前,遇到红灯如何处理,遇到绿灯如何处理,遇到黄灯如何处理等等。一旦任务决策给定了具体的任务,轨迹规划层将制定具体的局部行车轨迹,例如换道轨迹、超车轨迹。一般来说,轨迹规划层制定的轨迹不是特别长,约从当前车辆位置向前方延伸200米到300米。动力学与控制层通常分为上下两层,上层控制器的主要目的跟踪期望的轨迹,而下层控制器则实现对每一个执行器的控制。人机交互模块是智能汽车与驾驶人打交道的终端,是驾驶员了解各个模块的窗口。整个智能汽车的研究过程,大量涉及驾驶员行为特性的建模与分析,以及对道路及车辆性能的理解,包括安全性、燃油经济性、乘坐舒适性、交通平顺性和排放性等。对这些性能理解的深度,也决定了无人驾驶功能最终达到的高度。

0

环境感知技术是智能汽车的瓶颈之一。如图所示,道路的道路结构是异常复杂,且待检测信息高度冗余。交通流不仅涉及自车周围的车辆、障碍物、行人等多要素,而且人车交通流混杂,预测各自的行为十分困难。另外,行车环境也是种类繁多的,雨、强光、雪、雾、霾等天气影响很大。如何尽可能可靠地、准确地感知各类场景,这是我们面临的最大挑战。

0

目前,国内外主要有两类感知技术流派,一类是3D街景地图,加上360度扫描式雷达,以SLAM技术为核心实现环境感知。这一方案最早来源于移动机器人领域,理论上可以全方位感知周围3D环境,但成本高昂、数据量大、技术难度略高、对处理算法的实时性要求很高。

0

这是顶置式激光雷达所看到的道路场景。大家可以看到,它所扫描的环境信息以点云的形式存在。与摄像头的彩色图像相比,这是一张带景深信息的灰度图像。它所看到的周围环境都是一个点一个点描述出来的,具有对象的轮廓信息,通过机器学习算法能够识别车、行人、障碍物等对象的类型和位置,最后结合高精度地图实现车辆对环境的感知,以及车辆相对于环境的位置。

0

另外一类方案是多源传感器融合技术,起源于汽车行业对驾驶员辅助系统的研究。基本的思路是利用低成本、探测角度有限、探测距离长短不一的多个传感器,组合覆盖车辆周围的待探测区域。这一方案的成本较低,但对信息融合的要求较高。特别需要指出的是,目前这两类技术方案已不是完全的迥然相异,第二个方案也开始使用SLAM思想,第一个方案也加装其他传感器作为补充,二者已呈现相互融合,互相补充,互相促进的趋势。

0

当然,不同的企业倾向于不同的环境感知解决方案,这与各个公司的文化和技术背景密切相关。我个人比较偏向于第一个方案,或者说以SLAM为核心的环境感知方案。什么原因呢?主要是它具备更好的非结构化道路扩展能力。非结构化道路是指缺少规则道路标识的道路,例如乡村土路等,没有限速标识,没有红绿灯,没有车道线,没有中心线,没有明显的路沿,甚至道路表面也是十分不残缺不全的。像是这种缺少标识的道路,人是可以驾驶的,但如何让机器感知环境是比较困难的,理论上激光雷达的深度点云是可以实现识别的。上图是乡村道路的一个场景,这是智能车所看到周围的环境,实际情况也大致如此。

0

任务决策和轨迹规划是智能汽车的第二个关键技术,尤其是用于无人驾驶时。模拟驾驶员的特性是这一技术的核心思想。一般来说,人的驾驶过程分为三个层级,即导航层、引导层和操作层。第一个导航层是人要决定从清华大学到天安门,要走那条路。走四环的话,什么口进四环,什么口出四环。这基本上是现在导航系统的工作内容。第二个引导层是指到了每一条道路上,具体的驾驶模式是什么以及大致实现这个模式的行车轨迹。例如:我是要超车呢,还是跟着前面的车跑,还是换道到左侧车道,这是引导层的内容。第三个操作层是指具体怎么操作油门、刹车和方向盘,实现上一层的模式。例如:我计划要超车了,那就加一点油门,然后左打一下方向盘,然后从左侧的车道超过去。所以就是这操作层的主要工作。对于驾驶员来说,导航层是基于知识和经验的(Knowledge-based)。星期一早晨,西四环永远比东四环要堵一些,这是驾驶员的经验。引导层是基于规则的(Rule-based)。前车比我慢,而我又比较着急,所以选择超车,这是典型的条件语句。操作层是基于技能的(Skill-based)。熟练驾驶员的换道操作是自然而言的过程,不需要过多的思考。

一般情况,智能汽车的任务决策主要对应于人的引导层。任务决策与路径导航、动力学控制密切结合,共同完成自动驾驶过程的三个层次,即导航、引导和操控。无人驾驶汽车行驶之前,先采用导航算法搜索一条从起点到终点的可行路线,进入自动驾驶过程中,由决策模块决定具体的行车模式(超车、换道、跟车等等),并规划每一个模式的行车轨迹,最后由自动控制算法实现对行车轨迹的跟踪。整个无人驾驶过程也要考虑人和车的交互。因为人是智能汽车的最终使用者,他的需求与特性决定了智能汽车的功能,如安全性、经济性、舒适性、交通流平顺性等。

0

轨迹规划与任务决策通常是密不可分的一对整体。目前,不少决策算法是忽略路径搜索结果的,这是不合理的。对于稀疏交通流,决策结果通常是“可执行”,但是对于拥堵复杂工况,以规则为核心的决策未必可给出“可执行”的路径。这实际上要求决策模块要采用轨迹规划模块试探可行路径,将不可行路径对应的决策直接删除。另外,为了评价每一个决策的具体性能,也需要依赖这个决策对应的行车路径进行评判。当然,轨迹规划本身就是一个十分困难的问题,它的困难来源于两个因素。第一个是车辆本身是受动力系、转向系、悬架系等动力学系统约束的,不是一个各个方向都已可以移动的机器人。从学术上说,这是非完整约束系统,它的横向、纵向和横摆方向的自由度是受限的。

0

第二个是周围车辆是不断移动的,不是固定的静止障碍物,这需要对周围车辆的未来行为进行预测。然而,预测都不是一件容易的事情。对于人来说,旁边的车是酒驾司机,驾驶行为看起来比较激进,我们开车时要躲得远远的。但是智能汽车知道吗?它很难知道这是一个激进的驾驶员,还是一个保守的驾驶员。另外一个典型的例子是拥堵工况的预测。比如说四环路堵住了,但马上要出下一个出口,需要加塞到旁边的车前面,人总会设法挤过去,挤不过去先等等。但是智能车会挤吗?它怎么预测旁边的司机不让我挤,挤不过去能不能等一下,对于机器来说,这几乎是无解的问题。谷歌的无人驾驶汽车已经做得够好了,但是和公交车挤的时候,还是失败了。所以说,智能汽车的真正困难不在于一个个具体的算法,如何综合预测和评判周围的环境,将是一个极具挑战的难题。

0

我们看一下戴姆勒S500的路径规划是怎么样做的?人的眼睛所看到的东西,比传感器所了解的信息丰富太多。从图中看出,这一辆车所感知的周围的环境的信息,比驾驶人所知道的信息少很多,如何利用这么少的信息做决策和判断呢?难度可想而知。对于环境感知和任务决策的技术难度,我想补充一点题外话。我曾跟美国的朋友开玩笑说,“谷歌的无人驾驶汽车能够在加州上路,但是不一定能够在北京跑。如果不相信的话,请到清华大学旁边的五道口看一下,请开车走一下西直门立交桥。”北京道路要比加州道路复杂很多,交通流也密集很多,尤其是城市道路中,电动车、行人、自行车、机动车混杂行驶,而且行为的不规则性大大高于国外。这是为什么无人驾驶汽车挑战性十分高的原因。

0

另外一个核心技术是动力学控制。动力学控制所用的执行器基本上已经成熟,主要汽车行业的一级或二级供应商掌握,比如德国的博世,美国的德尔福,日本的电装等。智能汽车执行器一般来说包括三个:一个是线控转向系统,控制方向盘转角或者转动速度。第二个是驱动系统,一般是直接向发动机ECU发送力矩控制命令。第三是要控制制动,或者是EBS的制动力命令,或者是ESP的制动力命令。如果说这些执行系统控制端口不对无人驾驶系统开放,无人驾驶系统可能只能够停留在样车阶段,很难走到产业化阶段。

0

高性能的动力学控制是实现自动驾驶功能的一个屏障,但到目前为止受到的关注度不高。目前的技术难题有两个:第一个是极限工况的横向动力学控制,最核心是轮胎动力学特性。第二个是满足多性能需求的纵向动力学控制。例如:满足安全性和舒适性的前提下,实现纵向控制的燃油消耗最小化。这儿主要讨论第一个问题:轮胎是一个特殊的半柔性部件,它具有侧偏、饱和、纵横向耦合等特性,且随着雨、雪等路面参数变化很大。不难看出,目前国内外无人驾驶汽车的行驶道路都是干燥的、整洁的,不存在雨路、雪路、泥路等特殊路面。但是汽车的行驶环境是多种多样的,这样的环境下车的控制与常规情况十分不同的。

0

这是我与美国斯坦福大学合作的一个研究。它的环境和决策是已知的,主要目的是控制车辆的前轮转向和差分制动,达到极限的过弯性能。目前已展示出一些赛车驾驶员的操控特征,例如逆操舵的驾驶技巧(COUNTERSTEERING)。这一技术的最终目的是模仿赛车驾驶人,在操纵极限的情况下自动控制车辆,将轮胎性能运用到极限状态。

0

最后一个关键技术,目前阶段也更少提到,是人机交互。为什么人机交互对智能汽车仍然重要呢?这与无人驾驶汽车的功能是有关系的。传统汽车主要由人进行操作,所以人机设计的核心是补足人的缺陷和弱点,例如:减少眼睛视点的转移,增加操作的便利性,降低驾驶负担等。但是智能汽车不一样,无人驾驶过程中多数情况人是可以喝咖啡、读报纸,处于放松的状态,但是无人驾驶功能又不能完美到完全摆脱人的介入。所以它的一个重要任务是时刻了解人所处的状态,唤醒人的驾驶警觉性。一旦出现系统不能处理的情况,需要根据驾驶人的当前状态,唤醒驾驶员,让驾驶员在合适的时机接管车辆的控制权。

0

人机交互涉及的另一个难题是人对系统的信任问题。不知道大家是否乘坐过自动驾驶功能的汽车?当乘坐这类汽车的时候,人是不知道车要干什么的,车总是像一个幽灵一样,莫名其妙地加速、减速、转向,很容易导致人的不信任感。这个感觉,极其类似于一个老司机坐在新手旁边,总是感觉新手开车到处都是毛病,而且种种挑剔的眼光之下,不是毛病的地方也成了毛病。信任问题的解决可能不是一朝一夕的,需要系统全面了解驾驶员的认知、判断和操作特性,全方面模拟成熟驾驶员的风格与特性,最终达到人机一体化的驾驶效果。从这个角度说,人机交互可能是决定无人汽车市场化的最后一道门槛。

0

最后讲几个不同级别的智能汽车例子。通用公司的SuperCruiseSystem,集成了纵向和横向的自动控制功能。

0

郑州宇通的iBus,具备结构化高速公路的无人驾驶功能,已经具备完全独立的自适应巡航控制和车道保持功能。

0

这是我比较喜欢的汽车队列视频,也是沃尔沃的朋友做出来的。未来的道路上,无人驾驶车不会孤立的行驶,极有可能是以队列的形式的行驶。组队行驶的另外一个优势是希望无人驾驶汽车的跟车距离进一步缩短,甚至到4到5米,通过降低后车风阻的方法,进一步提高燃油经济性。目前这个概念已经通过道路测试。比如说瑞典的SARTRE项目,日本EnergyITS项目,美国的PATH项目,以及欧洲最新的GCDC项目等。

0

最后简要结束我的演讲,主要落脚到无人驾驶汽车上,或者第三级的智能汽车。无人驾驶汽车的研发难不难?重复我刚才所讲的观点,以我十年多的从业经验感受,极具挑战性。大量使用各种各样的先进技术,包括信息融合、机器学习、人工智能、路径搜索、自动控制等,其庞杂程度是很多产品难以企及的。将来无人驾驶汽车的开发有哪些问题值得关注呢?我大概的总结一下。第一是对道路交通的环境认知能力有待提高,对环境状况的判断能力仍然不足。即使达到99%的准确判断,但最后的1%的不足很可能让智能汽车功败垂成。第二个是复杂行车环境下准确的状况判断能力仍然有待提高,与半自动、手动驾驶车辆间的交流与理解,对交通规则、汽车语言、交通常识等的理解与判断。第三个是智能车辆与驾驶员的交互与理解能力,包括对人的状态和意图的理解与感知,这个问题有可能会制约无人驾驶的市场化前景。第四个是对道路交通乃至社会的影响,也是政府关心的问题。无人驾驶汽车成功了,无论是IT行业或者说是汽车行业,造出来了、卖出去了、盈利了,但是对整个道路交通有无益处呢?如果不仅没有益处,反而降低交通的效率,增加事故率,政府会不会答应这样的“下一代马路杀手”上路呢,这值得进一步探讨与分析。

最后是我一个小小的思考,我觉得无人驾驶汽车,如果深入之后会发现总体方案和技术体系其实是各种各样的,存在很多类型不同的变种。一些技术方案可能适合欧美,但不一定适合中国,如何去选择适合中国的技术发展路径,这是我们作为中国智能汽车研发人员必须关心的问题。而且,智能汽车发展也不是单独一个行业能够主导,很有可能是汽车、IT、交通、电子、通信等诸多行业共同合作,最后融合的一个产物。现在看到的一个状况是,IT行业的宣传口号最响,汽车行业在奋起直追,其他行业也不甘寂寞。我想最后能够形成这个产业的时候,应该不是哪个行业能够主导的,因为有车没有算法,有算法没有车,最后的结局应该都是一样的。我的演讲到此结束,谢谢各位的参与。

主持人:非常的感谢李老师的精彩分享,接下来大家有没有相关的问题可以向李老师提问?

提问者:您好,在整个汽车的外部感知上,激光雷达几个线的比较合适?

李升波:感谢你这个问题,十分好的问题,也很难回答。无论在美国,还是国内,我看到各类激光雷达都被使用过的。64线是谷歌的方案,用得非常好。加州大学伯克利分校用的4线加8线的方案,也不错。清华大学用的是4线方案加周围的传感器融合,现在觉得效果也还不错。我想制约选择什么方案的原因有两个:第一是成本。根据我了解,前几年64线的激光雷达是10万美元,4线的现在降到1万美元。如果说将来传感器的成本能够继续降低,围绕激光雷达的各类传感技术就更值得关注了。二是新技术的发展:值得一提的一个雷达技术是固态激光雷达。现有的激光雷达是机械式旋转,360度扫描环境。最近有一种固态扫描技术,与传统雷达类似于传统硬盘和固态硬盘的区别。如果固态扫描技术能够成功,64线的成本将不是问题,普及也指日可待。如果不成功,成本仍然是型号选择最重要的考量因素。

车联网联盟提问者:您好,感谢您的分享,我是车联网联盟的,我想要了解一下,咱们在智能汽车的领域里我分析比较关键的是VtoV,VtoI技术,我不知道您在这方面对目前咱们国际上最新的能够达到一个比较高的高度?或者说什么时候能够有实际的应用?

李升波:感谢您的问题,我不是车联网技术的研究者,对这方面的了解比较的粗浅。提到车联网的通信技术,我想一定要区分用途:一是用于车辆控制的车联网技术,二是用于媒体、娱乐或者服务(Telematics)的车联网技术。用于车辆控制的通信技术,日本电装等公司已有专用短途通信(DSRC)设备,基本功能已没有问题,但是多数人对通信安全性仍有一些隐忧。现在我们国内力推的车联网技术,主要是用于的车辆娱乐和服务的,例如:4G-LTE,其通信速度,带宽也已满足这方面的需求。下一代的5G技术,带宽可能到20Gbps,延时更小,可靠性和安全性更高,可能被用于智能汽车的感知、决策和控制。但是目前的4G技术用于车辆控制的难度较大,主要是通讯的延迟较大,可靠性不能满足车辆安全性需求,因为汽车一旦出错,是车毁人亡的事故,不仅仅是手机信号质量不好,通话质量欠佳的问题。

观点:李升波博士的专业性讲解,说明了做好自动驾驶系统并非易事。无人驾驶汽车发展之路虽然前途光明,但是环境感知、任务决策、轨迹规划、动力学控制以及人机交互等核心技术都亟待进一步提升性能。有车没有算法,有算法没有车都无法让智能汽车获得成功,各个行业的从业人员仍需共同努力。

相关专家
相关课题