文|刘俊宏
编|王一粟
全球AI顶会上,出现了越来越多中国公司的身影。
在过去,仍然是以阿里、字节等科技公司为主,但近些年正在出现更多来自产业端的声音。
今年,一家来自中国的车企也站在了ICCV(国际计算机视觉大会)的演讲台上。

近日,理想汽车自动驾驶高级算法专家詹锟在ICCV发表主题演讲《世界模型:让我们从数据闭环走向训练闭环》,阐述了理想汽车以“从数据到训练”的系统化思路,提出了全球首个将世界模型与强化学习闭环落地于量产自动驾驶系统的完整架构。
如果说上一代自动驾驶的“端到端”架构只能让自动辅助驾驶接近人类水平,那么“世界模型+强化学习”,有希望超越人类。
除了这次分享,仅在ICCV 2025上,理想自动驾驶团队就有5篇重磅论文入选。而近三年,理想汽车围绕端到端、世界模型、VLA模型等前沿技术,在多个顶级学术会议发表了近50篇论文。不仅如此,理想汽车将辅助驾驶部分代码和数据库开源,获得超过3200名开发者的收藏或调用。
就在中国开源大模型受到全球关注的同时,中国车企也正在为自动驾驶贡献中国力量。
找到了正确的技术路径,理想汽车的自动驾驶技术进步飞快。从“端到端+VLM”到VLA,理想汽车仅用了一年的时间,平均接管里程提升了近20倍。
理想汽车今年又发布了基于“VLA司机大模型”的下一代辅助驾驶技术,而VLA将成为实现L4级别自动驾驶的关键。
可以看到,理想汽车这种从数据到训练的闭环,既是中国科技公司务实主义的体现,又是智能汽车赢得智能化市场的战略底气。

就如理想汽车董事长兼CEO李想所言:“任何时候当我们想去改变和提升能力,第一步一定是搞研究,第二步是研发,第三步是把能力表达出来,第四步是能力变成业务的价值。这四个步骤是个极简的人类最佳实践。”
01 华山论剑 理想公开训练秘籍
站在AI大牛云集的ICCV 2025上,理想也能和其他顶尖AI公司一起华山论剑。
今年,理想拿出了一个有分量的分享——首个将世界模型与强化学习闭环落地于量产自动驾驶系统的完整架构。

ICCV上,理想分享的这套架构以世界模型为核心,靠区域级仿真、合成数据生成和强化学习三项关键技术,最终实现高效的自动驾驶系统开发工作。
这套架构,就是理想从2024年便开始预研的“VLA司机大模型”。
回顾理想发展的前两个关键阶段,从2021年启动自研辅助驾驶系统开始,理想完成了从规则控制的独立模块架构进化到端到端架构的落地。2024年,“端到端+VLM视觉语言模型”双模型的推出,就是彼时理想的一次阶段性成果。
但理想并不满足于此,具身智能领域的进化,让理想看到了辅助驾驶进化的可能性。
不过,要想快速做出更好的新模型,理想在上一代中就发现了一个问题——真实数据能解决的问题范围,越来越有限了。
虽然通过收集真实数据+前沿模型率先落地的方式,理想的数据飞轮得以越滚越快。然而在学习过程中,他们也察觉到了真实数据的缺陷,即这些数据本身难以覆盖足够的场景分布。
也就是说,在数据类型有限的情况下,AI渐渐学不到新东西了。
为突破瓶颈,理想决定将单一的数据闭环向更系统的训练闭环演进,给出了更聚焦、更全面的训练思路。
从数据端,理想选择采用大量仿真数据。简单来说,就是之前辅助驾驶训练是“有什么数据就锻炼哪些能力”,现在则是设定好新目标,通过合成特定数据,再用这些仿真数据支撑模型训练,实现“按需训练”。
数据有了,在哪训练更合适?为了给自动驾驶搭建“专属的训练场地”,理想引入了作为训练闭环的核心——世界模型,它担起了训练、数据和强化学习三块关键任务。
首先,世界模型能提供一套仿真系统,让辅助驾驶模型能在模拟环境中“畅跑”。接下来,理想会在世界模型中添加合成数据,给辅助驾驶模型的“道路”添加场景和障碍物。最后,理想使用强化学习给辅助驾驶模型设计目标,直到训练完成。
在这套完整的框架里,理想还给出了一系列配套技术。例如能生成道路场景的场景重建、多传感器渲染、多模态生成技术;让合成数据“动起来”的交通智能体、3D资产库;还有给模型“打分”的评价反馈系统。
事实证明,全新的技术路线能显著加快辅助驾驶模型的迭代速度。
今年七月底,光锥智能受邀参与理想VLA司机智驾体验日时,理想汽车自动驾驶研发高级副总裁郎咸朋分享了一个案例。在一个汽车左转的场景中,VLA模型仅用了13轮训练就通过了原本“撞车”的场景,随后在第二十轮“毕业”。
顺着这条思路,理想还发现仿真环境训练能为辅助驾驶研究省下大把的开销。
“从2024年做端到端的时候,平均下来成本降到了5块钱一公里,”郎咸朋说,“现在的VLA,我们都是用仿真测的,5毛钱一公里,就是付个电费,付个服务器的费用。并且测试质量还高,所有的case、所有的场景都能举一反三,可以完全复测,分毫不差。”
由此,距离上一代模型不到一年,理想在今年进一步推出了VLA司机大模型,一是借用大模型的能力,让辅助驾驶像人类一样深思熟虑地驾驶;二是通过这套融合强化学习与训练闭环体系的全新架构,提升模型的智能上限。

不过,在这条尚属空白的领域中,要交给理想蹚过的河还有很多。詹锟也在ICVV上指出,由于强化学习引擎对泛化性、时效性和并发度均有较高要求,理想汽车正持续推进这一技术难题的攻关与突破。
VLA更关键的意义,是让理想看到了辅助智驾在进入平稳期之后,突破至下个里程碑的可能性。
“上一代技术能力的上限,是下一代技术能力的起点。”郎咸朋预测,通过上述训练方式,理想有机会让辅助驾驶能力飞跃一个量级。
“如果MPI(平均接管里程)真正能提升到1000公里,就意味着系统可能真的是两三个月才接管一次,这可能意味着辅助驾驶迈入到下一个时代了。”郎咸朋说。
02 自动驾驶技术的“乘数效应”
作为一名车企,理想已经是AI国际学术会议上的“常客”了。
近年来,围绕端到端、世界模型、VLA(视觉–语言–行动)等前沿方向,理想已经在CVPR、ICCV、ECCV、ICRA、CoRL、NIPS等国际顶级学术会议上发表了近50篇论文。

“任何时候当我们想去改变和提升能力,第一步一定是搞研究,第二步是研发,第三步是把能力表达出来,第四步是能力变成业务的价值。这四个步骤是个极简的人类最佳实践。”李想分享过从技术到业务价值的方法论,这也成了理想做技术投入的准绳。
正是基于这些基础研究,才促成了理想辅助驾驶2年三次迭代,从“追赶者”摇身一变成为行业的头部。
每一次业务价值的突破,都能在技术研究中找到源头活水。
比如,当自动驾驶进入端到端技术时代后,如何高效利用海量的驾驶数据,如何构建高质量的训练场景,成为所有车企面临的共同挑战。
于是,2023年10月,理想在ECCV 24会议上提出了StreetGaussians技术,提出了一种能够快速构建并实时渲染的动态场景表示方法,让实时渲染场景走入现实。这项技术不仅为理想的端到端+VLM双系统辅助驾驶提供了高效迭代的数据基础,还为自动驾驶仿真训练提供了技术支持。
2025年6月,理想联合悉尼科技大学发布了业界首个大规模真实3D车辆数据集3DRealCar。和以往要么来自合成、要么低质量的数据集相比,这个数据集做到了高质量(100+不同品牌汽车)、高数量(2500+辆汽车)。它还采用了完全开放且可商用的Apache 2.0协议,从而迅速被行业头部公司采用。
优质数据有了、训练效果提升了,理想开始着手让模型学会“自进化”,加速模型的迭代效率。
这就是2025年6月,理想World4Drive技术的由来。这是业界首个通过自监督学习实现无需感知标注的端到端框架。
对比传统的自动驾驶系统需要大量人工标注数据来训练感知模块,World4Drive则通过自监督学习构建潜在世界模型,让系统直接从原始驾驶数据中学习如何规划路径,从而加速了模型的迭代效率。
这种让训练流程变成“自动化流水线”的能力,正是当前大模型时代最具价值的技术方向。

这些看似分散的基础研究,最终汇聚成了理想今年的核心成果——VLA司机大模型,通过加速模型训练效率和质量的方式,加以强化学习能力,让模型变得更“聪明”。
基础技术的积累最终触发了“乘数效应”,在经济学中,最初投资的增加引起的一系列连锁反应,会带来收入的数倍增加。一项项技术累积,则成为了理想被用户选中的基点。
辅助驾驶的使用数据,是最好的佐证。截至2025年10月17日,理想用户辅助驾驶累计用户达到140万人,辅助驾驶累计里程达到53.7亿公里,主动安全累计避免潜在事故1036万次。
将用户安全、顺畅地送到目的地,是用户选购理想汽车最大的期望。
03 李想的AI理想 从成就自我到惠及行业
中国的智能汽车,正在重走乔布斯的来时路。
1993年,乔布斯关闭了NeXT电脑的硬件部门,转向到纯软件公司。面对这场失败,乔布斯承认硬件创新的“壁垒”很低,“在硬件方面,你再也无法构建一台比别人好两倍的计算机了。太多人知道怎么做了。你很幸运如果能做出比别人好1.3倍或1.5倍的机器,而且其他人只需6个月就能赶上。”
硬件竞争到最后,比拼的还是软件。
中国智能汽车发展初期,理想用“冰箱彩电沙发”的配置率先赢得了市场。但短短几年之后,豪华内饰就成为了“稀松平常”。当下的智能汽车行业,开始转向强调AI的价值。
例如传统豪华汽车品牌宝马、奔驰、奥迪的智能化转型第一步,就包含用豆包大模型改造智能座舱。理想在发布代表intelligence(智能)的理想i8时,发布会用了三分之二的时间谈了VLA司机大模型和Agent智能座舱。
既然AI是未来,那就重金投入。
据李想透露,理想在AI模型、算力以及基建方面,一年投入了60多亿。虽然烧钱,但李想认为这一切都十分值得。“它短期不产生直接商业回报,金额巨大。但若不投入,AI就无从谈起,投机取巧做不了AI。”

有舍才有得。中国古老的处世哲学,正在映照在AI领域上。
中国的开源大模型,在国际得到的认可度越来越高,除了商业模式之外,这种开放共赢的心态,也是每个有追求的创业者“兼济天下”的理想。
从中国互联网行业刚起步时期就开始创业,至今已经20多年的李想也有更高的追求。于是,在技术路线上,理想汽车一直都在毫不吝啬地开源。
在自动驾驶领域,理想一直在开源。理想开源的LiAutoAD仓库,分享端到端代码和基础模型,被3200+开发者调用。自2021年以来,理想汽车围绕BEV(Bird’s-eye-view,鸟瞰图)、端到端模型、VLM视觉语言模型、VLA模型、强化学习、世界模型、AI基座模型等领域,发表近50篇论文,被引用超过2400次。
在汽车操作系统领域,理想今年也开源了自研的汽车操作系统星环OS。该系统研发的初衷,是用统一的操作系统打通各个汽车控制器,实现极致的软件效率。
开源之后的效果,理想汽车星环OS的架构负责人黄震认为,是解了行业的“燃眉之急”,“反馈比我们想象中积极。很多车企现在还没有做自研操作系统,不是认为没必要,而是一开始可能没腾出手来想这件事。”
9月16日,理想与长城汽车、英飞凌、中科创达、德赛西威等共16家生态伙伴与理想共同签署《星环OS社区章程》。标志着星环OS正式从理想内部走出,成为汽车厂商打造汽车智能的选择。
从技术到经济,无疑都是越开放、越上升,越合作、越共赢。
DeepSeek一开源就名扬天下,推动了整个中国AI向前发展快了大半年;阿里通义千问的开源,也被英伟达黄仁勋盛赞冲到全球开源模型榜第一。
“如果没有开源,AI又怎能取得近年来如此巨大的进步呢?开源能够吸引各类公司的参与,从而保持生态系统的创新性、安全性和责任感。它让成千上万的研究人员得以投身于AI创新之中。”英伟达CEO黄仁勋曾发出的感叹。
更开放的理想汽车,正在成就更多人的理想。
本文来自投稿,不代表增长黑客立场,如若转载,请注明出处:https://www.growthhk.cn/cgo/model/146292.html
微信扫一扫
支付宝扫一扫