“去哪儿都能开,全国都好开。”9月19日,智己汽车宣布IM AD无图城市NOA将于10月正式全国开通,并逐步推送全系车型。智己IM AD是全行业第四家量产应用“全国都能开”的无图城市NOA,通过端到端大模型,能真正实现全国城市、全国道路、全国路况“都好开”。
全新智己LS6,上市即交付
无图城市NOA功能
这套全新的无图城市NOA由上汽智己与智驾头部企业Momenta共同研发,双方紧密协作给用户带来了丝滑、高效、更像人的智驾体验,也标志着上汽在智能驾驶领域的产业金融投资正在开花结果。同样在9月19日,由上汽集团金融事业部/上汽金控主办的上汽集团2024年上半年战略直投业务协同推进会议顺利召开,会议围绕智能驾驶领域,邀请了多家相关企业代表作专题报告分享。
智驾能力已能影响用户消费决策
今年8月,极氪品牌推出了2025款极氪001,不少老款车主直呼“破防”:车辆的智能驾驶能力大幅升级,不仅智驾芯片更新、算力跃升,还搭载了极氪自研的浩瀚智驾2.0版本,实现了端到端智驾模型量产上车。
不惜背刺用户,也要火急火燎推出新款车型。这是因为智能驾驶不再是前些年概念炒作出的“体验玩具”,它已成为技术与商业模式同步走向成熟的“用户工具”。从15万元级别的小鹏MONA M03到50万元级别的华为问界M9,智驾能力涵盖汽车消费绝大部分价格区间,成为一项在不少用户买车时足以影响消费决策的功能。
这种变化的发生,得益于技术的升级迭代。在战略直投业务协同推进会议上,中信证券产业策略分析团队将目前智能驾驶技术的演进趋势归纳为从“BEV+Transformer”到“端到端”的两段升级。
感知“组合拳”,实现去高精地图
过去,智能辅助驾驶技术感知与规划控制,需要基于传统的2D、3D数据标注与大量规则的处理,不仅规则复杂,而且高度依赖高精地图。这种传统的智能驾驶方案既难以降低成本,又难以实现泛化性,智能驾驶被局限在了特定的场景中,更适用于商用车领域。
要想在乘用车上推广智能驾驶,就必须面对千变万化的城市复杂场景,摆脱对高精地图的依赖。“BEV+Transformer” 与“Occupancy Network”的“组合拳”,让这一目标成为现实。
BEV技术,即鸟瞰视图(Bird's-Eye-View)是一种从上方观察车辆所处场景的感知技术。应用了BEV技术的车辆,能够将各类传感器(如摄像头、毫米波雷达、激光雷达等)收集的数据映射到从上方俯视车辆的视角画面中,从而提供更全面、更准确的环境感知信息。BEV技术相当于在数据标注前进行了一次数据的前融合,主要有三个优势:一是可以解决图像视角的遮挡问题;二是为后期规划与控制提供了便利;三是统一了多模态数据的处理维度。
不过,由于综合了多个传感器信息,BEV技术面临着数据量庞大的挑战,如何将不同传感器的特征进行最优地表达和融合,最终将所有数据映射到鸟瞰视角,就需要Transformer神经网络模型来处理。相比过去智能驾驶采用的卷积神经网络技术,Transformer模型可以并行化处理并借鉴人脑的注意力机制,在处理大量信息时能够只选择处理关键信息,更高效地挖掘数据序列中不同元素的联系及相关性,并进行全局关系建模,不仅更适宜大规模数据训练,也更适合进行BEV所需要的特征学习。
此外,过去智能驾驶技术还有一个颇受诟病的缺点,就是需要依赖数据库中的标注“经验”进行物体识别,遇到未被标注过的障碍物,也就是所谓的“边角案例”(corner case),智驾系统就有可能无法识别而产生误判。这一问题的解决,得益于Occupancy Network(占用网络)技术。简单来说,Occupancy Network是一种通用算法,它将核心问题由“识别”转变为“占用”,不再需要确切识别物体的形状、知道障碍物是什么,只需要判断其是否“占用”了行进路线中的网格,就能做出避障、绕行的判断。
智驾的核心问题由“识别”转变为“占用”
总体来看,“BEV+Transformer”与“Occupancy Network”这套“组合拳”提升了智驾系统的泛化能力。通过这些技术对传感器感知到的信息进行处理,车辆可以实时构建“高精地图”,因此可以走出预先设置好的高精地图带来的局限,摆脱对高精地图的依赖。目前,在这一系列技术的加持下,“重感知,轻地图”已成为大部分整车厂与智驾企业聚焦的研发方向。
拥抱“端到端”,推进数据驱动
“BEV+Transformer”让智能驾驶的感知部分用上了AI模型,“端到端”则是让规划和控制部分也能用上AI大模型处理问题。
过去,智能驾驶的感知端和执行端依靠规则连接,也就是所谓的规划与控制(规控),是由工程师编写大量人工规则(即大量代码)实现的。例如,特斯拉FSD V11版本就包含30万行代码,其中大部分都是人工规则。这不仅导致代码冗长,基于规则的智驾方案也会显得机械、笨拙,只能按照规控的代码采取保守的策略,在应对堵车、加塞等交通博弈时,远不如人类司机处理灵活。
基于规划控制代码的智驾方案
十分复杂
“端到端”就是感知端直接到决策端,把规划控制端的工作交给神经网络模型来做,用模型取代工程师编写的代码,让感知端传感器输入的信号直接产生执行端输出的控制轨迹,大幅提升模型的训练效率和性能上限。如果把智能驾驶比作一名学生,要想在智驾考试中取得好成绩,就要采用题海战术来练习。“端到端”将智驾模型迭代的关键由“工程师”变成更易于规模化的“数据和算力”,自然就会成为智能驾驶的“刷题利器”。
在这一过程中,“题库”的体量与质量,也就是用于训练智驾模型的数据愈发重要。“经过由硬件驱动的1.0阶段和软件驱动的2.0阶段,智能驾驶正迈向由数据驱动的3.0阶段,数据将成为更重要的关键胜负手。”在战略直投业务协同推进会议上,中信证券产业策略首席分析师连一席表示。
拥抱“端到端”,以数据驱动智能驾驶模型迭代,这一理念与目前智能驾驶行业头部企业的洞察不谋而合。“要想打造比人类司机更安全的智能驾驶系统,核心是要解决长尾问题,可能将面临上百万个长尾问题。这些罕见长尾问题的识别、验证,需要1000亿公里的驾驶里程。”Momenta联合创始人、战略和商务副总裁孙环告诉记者,“所以关于解决长尾问题,我们有两点洞察:一是需要数据驱动,并且能够自动解决长尾问题,基于规则的方法是无法处理的;二是需要使用量产车辆为L4级智能驾驶收集数据,仅用L4级Robotaxi车队无法满足要求。”
智己与Momenta联合打造的
IM AD“全国都好开”
基于上述洞察,Momenta提出了智能驾驶的“摩尔定律”:通过数据积累,每两年实现硬件成本减半,软件体验提升10倍。“预计6-8年后能实现规模化的L4级别智能驾驶,体验比今天的L2+级别智能驾驶提升1000-10000倍。在保持同等算力的情况下,无图城市NOA的硬件成本或将下降至4000~5000元。”孙环表示。
此外,除了在汽车上有望得到广泛应用,“端到端”大模型还对其他高科技行业有明显的技术溢出效应。例如,“端到端”的具身智能大模型是人形机器人实现通用性和泛化能力的基础。“特斯拉使用了1000万条30秒视频数据训练端到端的FSD V12自动驾驶,机器人面对的任务和场景比自动驾驶丰富得多,预计需要1亿条数据训练基础模型。特斯拉雇佣500名采集员,采用“三班倒”工作方式,全年预计采集等效1.5亿条30秒视频数据。”智元副总裁姜青松表示,“基于这样的数据能力,再结合算法和算力,构成了AI三要素,使人形机器人从基础自动化时代的人工任务编排,提升到具备通用原子技能的任务编排大模型,并逐步迈向具备认知推理能力的通用操作大模型。”在低空经济领域,容亿投资高级合伙人赵炬指出:“汽车的智能驾驶和飞机的智能驾驶都有自动、安全的需求,但是二者的侧重点不同。飞行器的环境互动要求不及汽车复杂,但是感知层面需要三维定位,航路规划和动态避障策略要求更高,各系统安全性保障要求更高。”更复杂的感知,以及更高要求的安全等特点,同样对“端到端”大模型的应用产生了需求。
加大协同,加深赋能
产业金融投资助力智能驾驶
上汽集团是Momenta最大的OEM股东。智己的IM AD无图城市NOA,可以说是上汽的产业金融投资与投后协同赋能的又一个成功案例。从享道Robotaxi的L4级自动驾驶解决方案,到智己和Momenta联合发布首个D.L.P.(深度学习规划)人工智能模型,再到如今的IM AD无图城市NOA,上汽和Momenta不断深化合作,产业金融投资也随之持续开花结果。
一套成熟的智能驾驶系统包括感知系统、定位系统和计算平台在内的量产应用。IM AD无图城市NOA不仅仅是上汽智己和Momenta的合作,更是上汽体系内相关产业链企业与上汽体系外已投企业的一次能力整合,业务合作纵横交错,对协同赋能的需求更加迫切。
“智驾域控制器是一套基于千兆以太网骨干网的多芯片异构计算平台,开发过程中遇到的挑战有很多。”联创汽车电子智驾域控制器产品经理杨曾告诉记者,“需求不清晰,多个合作方的技术边界也不清晰,开发初期单点能力与系统能力都缺乏,外部输入变更频繁,多个参与方还有观念与利益冲突。”
为了应对这些挑战,联创汽车电子借助上汽产业金融投资的产融协同,在产品定义阶段就整合多方需求,并通过灵活的商业模式来适应行业、客户的变化;在研发阶段,优化开发流程,保证开发的可复制性,并通过工具链的建立与优化提升开发效率和方案迭代速度。目前,联创汽车电子的智驾域控制器产品已搭载在上汽智己、上汽红岩等品牌车型上。
联创汽车电子的智驾域控制器
已搭载在智己汽车上
对于整个汽车行业,智能驾驶的价值不言而喻。借助产业金融投资,加强与产业链、生态圈各方的战略合作与协同,推动金融与产业良性互动发展,不仅是对金融投资的价值挖掘,更是深化产业布局的价值创造。
当前,在乘用车智能驾驶领域,智驾功能、智驾方案都已经出现了因车型定价分化的态势:低端车型追求极致性价比的智驾方案,带动高阶智驾下沉;中端车型要求较高的性价比与泛用性较强的智能化水平;高端车型要求极致的智能化水平和更优的驾乘体验。行业的分化叠加快速迭代的技术,对产业链的协同合作提出了更深层次的要求。作为串联智能驾驶产业链各个环节的纽带,产业金融投资也迎来更多机遇和挑战。
“加大协同,加深赋能。”这是上汽产业金融投资的重要使命,也是助力智能驾驶关键技术突破、实现价值创造的必经之路。未来,上汽集团战略直投将继续紧密围绕集团战略,进一步加大协同、加深赋能,真正发挥CVC产业资本的优势,更好地推动已投企业与上汽产业生态实现双向赋能和价值共创。