{{detailStore.author.is_follow?'已关注':'关注'}}
还记得理想 i8 发布会上,那段让人听不太懂的 VLA 司机大模型介绍吗?其实,那已经是最浅显的版本了。 因为在刚结束的 ICCV 2025 上,理想拿出了更多技术分享。理想这次发表8 篇论文,其中 5 篇来自自动驾驶团队。理想还发表了题为《世界模型:让我们从数据闭环走向训练闭环》的主题演讲。对普通人来说,听起来更晦涩,但意义更大,也展示了更多细节。 就比如说其中一页细节,在我们已经熟悉的 VLA大模型基础上,这次更详细地阐述了理想i8发布会上首次出现的 RL 和 WM。RL 是强化学习,最近行业里也很火,Momenta 就一直在强调强化学习。 RL 包含多个分支,比如基于人类反馈的 RLHF、基于可验证奖励的 RLVR、以及结合 AI 反馈的 RLAIF——通过这些范式,能够让模型自己进行持续的训练、总结和改进。 WM 则是 World Model,也就是世界模型。它是让模型理解环境、生成场景、在虚拟世界里反复训练的“大脑”。把这些要素结合起来,才是理想辅助驾驶系统的完整架构。 如果你细心地话,就会发现李想在AI Talk中已经提到了强化学习和世界模型,而这次学术会议上理想则是进一步阐述。 怎么理解它们的关系? 如果说 VLA 是车端的“司机”,那世界模型就是“教练”。它能生成道路、交通、甚至突发事件,让模型在虚拟环境中完成自我训练。之前受限于自然场景,很难采集到足够的数据进行研究,但在世界模型里可以通过不断生成环境和反复训练收集数据,并根据数据进行环境的迭代,最终达到目标。强化学习让它更聪明,世界模型让它更完整。 那问题来了——一个造车企业,为什么要发论文? 因为自动驾驶的技术进化太快。不发,就容易闭门造车、错过方向;发出去,同行能评审、能质疑,也是一种倒逼进步。代码开源、数据共享,也能潜移默化地影响行业。 这和理想当年开放操作系统是同样的逻辑——开源出去,让学生用,让同行用。大家用得多了,也形成惯性。先不说引领路线的作用,至少未来招人,也更容易找到“熟练工”。 你可能会说,这些离用户太远。天天发论文,是不是有点脱离体验了?但过去一年,理想的辅助驾驶进步已经能看见。理论和体验不是两件事,但理想二者都没落下。
  • 全部评论{{detailStore.commentnum}} 条
  • 只看作者
  • 最热
  • 最新
  • 最早

「待审核」

首评 {{ comment.relativeTime }} 已被赞赏 {{comment.integral}} 积分 回复

{{ type!=10 ? '前排沙发空着~' : '暂无相关评论' }}

{{type!=10 ? '还没有人评论哦,快抢沙发吧!' : '发表一下个人看法吧'}}
写评论
积分赞赏
点赞
评论区
  • 编辑
  • {{ is_favourite ? '已收藏' : '收藏' }}
  • {{ is_personal_top ? '取消主页置顶' : '个人主页置顶' }}
  • 举报
  • 加入黑名单
  • 内容{{ eyes_only ? '公开' : '仅自己' }}可见
  • 删除
  • 取消置顶
  • 置顶推荐
    • 6小时
    • 12小时
    • 24小时
    • 3天
    • 一周
    • 长期
  • {{ feature?'撤销':'进' }}精选库
  • {{ digest?'撤销精华':'设为精华' }}
回到顶部