当前位置: 满电-新能源汽车>智己郭辉:打造“更像人”的智能驾驶
立足于各种交通场景,智己打造“更像人”的智能驾驶。
导语网通社快讯 9月28日,由中国电动汽车百人会举办的2023年全球智能汽车产业大会(GIV2023)在合肥召开。在以“智能汽车产业化发展新阶段”为主题的高层论坛上,智己汽车副CTO、智能驾驶首席科学家郭辉以“‘更像人’的智能驾驶,智己对智驾技术的探索与思考”为题发表演讲。
郭辉表示,打造“更像人”的智能驾驶,是智己在智能驾驶领域一直追求的目标。智己实现的路径是基于数据驱动,立足于各种交通场景,打造有温度、“更像人”的智能产品,实现差异化的用户体验。
以下为演讲实录
首先我简短介绍一下智己汽车,我们是一家年轻的公司,也是一家快速成长的公司,成立于2020年12月25日,是上汽集团牵头成立的一家合资公司,致力于成为智能时代出行变革的实现者。我们在2021年发布了第一款车L7,并在去年6月开始交付给用户,也在用户的心目中打造了电动车驾控的品质标签。今年一季度我们开始交付第二辆SUV S7,在用户端也获得了好评。今年10月我们将发布第三款车LS6,将搭载最新的智驾技术。
今天我的报告分三部分:
第一,打造“更像人”的智能驾驶体验,这是在开发领域一直追求的目标。
第二,我们如何打造“更像人”的智能驾驶体验。
第三,报告一下我们在智能化技术演进方面的思考。
打造“更像人”的智能驾驶,是智己在智能驾驶领域一直追求的目标,我们实现的路径是基于数据驱动,立足于各种交通场景,打造有温度、“更像人”的智能产品,实现差异化的用户体验。
智己在智能化、智能驾驶领域所积累的优势来自于在上汽集团,2014年就已经依托于上汽的前瞻工程团队在智能驾驶领域进行相关的研究,在规控、智驾系统方面建立了丰富的技术积累。2017年,上汽集团成立了人工智能实验室,开启了在深度学习方面的全面布局。2020年,我们成立了智己汽车以后,和Momenta进行了强强合作,率先在智能驾驶这个垂直领域使用传感器、多任务的Transformer模型,基于时序BEV的机制实现了OneModel感知模型的逻辑量产,2023年一季度,我们联合Momenta发布了基于深度学习的规划这样一个人工智能模型。
什么是“更像人”的智能驾驶呢?我想借助几个场景的案例可能更容易帮助大家理解。
第一个案例,关于拥堵插空变道,这是我们在日常生活中最常见的交通场景,这个场景对于现在的智能驾驶挑战还是比较大的,因为这个过程中车辆在不断加减速,周围的环境在动态变化,车与车在拥堵的情况间隙也非常小,一方面要求感知精度要非常高,对于周围车辆的轨迹预测要非常准。二是对于我们在关联系统,包括像横向的控制、纵向的控制,要求非常精准。这个视频展示的是智己汽车的智驾系统在拥堵的交通场景下实现了丝滑的编导,体现了“更像人”的感知和规划决策。
第二个案例,一个拥堵跟车的场景案例。从左边这个视频可以看到,这个橙色的框代表了智己的智驾系统基于算法做出来的结果,白色的框是专家司机开车时候的状态。从这个图可以看到,他们之间的差距相对是较小的。在整个智驾的开发过程中,我们通过大数据的驱动,也会根据用户的驾驶风格去学习用户所习惯的跟车安全距离、以及相应的车速,带给用户最舒适的智驾感受。
第三个案例,这是一个复杂的场景用户交互的例子,因为在自动驾驶的时候,往往用户的痛点是不知道什么时候要接管,在智己的智能驾驶当中,我们通过风险等级预警和多模态的交互方式,通过直观的表达,比如类似于WiFi信号这样的标记,能够让用户清晰的感知到系统对于当前场景处理的信心,提升用户在使用智驾系统时候的安心感和信任感。
当然正如前面张院士所提到的,我们现在智驾技术一方面在快速的发展,朝着L4+这样的方向前进,同时我们也还将长时间处于人机共驾的阶段,所以一方面智驾技术本身的发展非常重要,另一方面在人驾的环境下、场景下智驾如何服务于人驾,这也是具有很高价值的用户场景。
我们举了三个例子,这是智己的智驾系统当中我们认为对于人驾当中能够提供比较高的用户价值的场景。
1、一键脱困。这是我们用视觉融合泊车能够轻松的泊入一些困难的车位,当然当我们要泊出来的时候不那么容易,可以使用一键脱困的功能,轻轻一键可以用智驾系统帮你能够从复杂的环境当中轻松脱困。
2、一键贴边。我们在水平车位泊车的时候,即便有经验的司机都会感觉到还是有一些困难、有一些障碍的,使用一键贴边的功能可以帮助我们的司机尤其是新收司机可以轻松的对齐一键贴边。
3、一键循迹。针对小区的场景,大家开到小区找车位,开到那个地方发现已经停满了,但是要从里面倒出来,只有一条道怎么办,一键循迹的功能可以帮助驾驶员轻松的返回原来的位置。
当然在L2+方面智己已经量产了非常多的功能,包括像高速领航功能,我们今年4月份发布之后今年年底也会覆盖全国,包括去高精地图的NOA,昨天也已经开始了正式的公测,城市NOA在10月份我们会开启正式公测。
这里举的两个场景案例,关于城市领航辅助的场景。
第一个案例,在路口的时候,这是一个右转,会经历一个突然穿插出来的两轮车、还有过路的行人,这个过程中可以看到,我们的智驾系统做的精准的判断,并没有刹停,而是通过平稳避让的方式、通过无接管的方式通过了转弯的路口。
第二个案例,在夜间的人车混流的场景,大家可以看到,在画面的上方还有一部分是逆光的环境,即便在这样的复杂环境中遇到前方有障碍车辆,智驾系统页能够轻松应对绕行通过。
整体来讲,智能驾驶特别是在L2++这个阶段如何为用户提供更大的可感知的价值是我们追求的方向,这也是我们为什么打造“更像人”的智能驾驶。从智己的智驾功能迭代路线来看,泊车方面,从更多的停车场场景的扩展,从功能上现在的视觉融合泊车、到记忆泊车、到代客泊车,不断进行拓展。行车方面,从原来依赖于高精地图的领航辅助,到逐渐实现重感知、轻地图的领航辅助,同时从原来少量场景的领航辅助行驶到端到端的智慧出行,这是我们在行车方面的一个技术路线。
如何实现“更像人”的智能驾驶?智己也打造了智能驾驶的技术平台,下面我从三个方面来进行解释。
第一个,硬件方面,要有一个高效的计算平台。从智己在硬件方面的规划,我们坚定的走视觉融合的一条技术路线,从传感器规划方面,我们使用了11个摄像头、5个毫米波雷达、2颗激光雷达,随着算法能力的提升,我们会减少毫米波雷达和激光雷达的数量,摄像头是我们主要的传感器。算力平台方面,我们使用英伟达的大算力芯片,硬件形态上,从原来的行泊一体的功能域控制器会向舱驾融合的计算平台发展。
计算效率,对于模型的工程化我们实现了500%的效率提升,带来的结果是90%的算力下降。因此,基于有限的算力平台可以实现全域的视觉融合,同时单激光雷达就可以覆盖全量的城市场景以及区域高精地图这样的算法。
第二个,很重要的是算法的持续迭代和性能的快速升级。包含两方面,一方面是感知智能方面,我们叫DDLD和DDOD,就是基于数据驱动的道路环境检测和基于数据驱动的目标检测。基于数据驱动的道路环境检测,是指我们在车辆的行进过程当中可以进行实时的建图,并且能够通过多次的行驶将感知的结果进行融合,能够更好的去识别道路的特征。在DDOD来讲,我们会结合使用空间占用网络,能够对通用障碍物进行识别,接下来在即将发布的智驾系统当中会应用DDOD的算法。今年4月份,前面提到我们发布的基于深度学习的规划算法,从DDOD到DLP都代表了我们在数据驱动这个方法论上不断的去演进我们的感知算法包括规划算法。
当然数据驱动离不开高利用率的数据驱动平台,智己也搭建了完整的数据链路工厂CLA4.0,可以实现对长尾场景的数据筛选,包括采集、处理、标注、评测、部署的整个自动化,可以实现从数据到算法的快速迭代。数据当然不光是用于算法的迭代,也用于研究用户的痛点在哪里,对实践的场景为未来的开发指明方向。当然我们所有的这些数据都会在车端进行脱敏,符合国家对于数据安全的要求。
最后简单谈一下我们对于未来智能化技术演进的两点思考。
第一个,在算法方面,前面张院士也提到,从算法的演进路线来看,从原来的单个模块的比如感知或者规划的数据驱动的链路,逐渐会演进为端到端的人工智能模型。
第二个,还有一个很重要的,在人工智能模型基础上要加一个安全的框架,因此我们也在开发基于规则的安全框架,作为未来智驾系统能够达到更高安全等级的技术储备。
除了智驾本身以外,目前随着电子电气架构的发展,舱和驾逐渐在融合,特别是结合人机共驾的场景,舱和驾是密不可分的。就像我们前面所讲到的,新的技术包括GPT的技术等等,都会带来智能驾驶和智能座舱进一步提升的可能,也使得他们加速融合。在生成式预训练技术的应用方面,智能驾驶我们目前正在探索的包含了在云端的仿真、包含用大模型训练小模型的探索,在智能座舱方面,基于在语义识别方面的优势,GPT技术可以一方面在云端提升人类对指令理解的准确度,同时这个模型小型化之后也可以部署到车端。
在智驾领域,一方面是智驾的算法在快速迭代,我们还是相信系统对于环境的理解,甚至在某些方面是可以超过人类的,所以会持续提升智能化的程度。当然随着V2X技术的发展,智慧的路也会对智能化起到非常大的帮助作用。
正如前面提到的,我们也相信智能驾驶不光是单独的发展,在今天人机共驾的场景下,我们使用智驾的技术去服务于人驾,更好的赋能人驾,能够实现用户体验更大的增值。