小米发布并开源Xiaomi OneVL自动驾驶模型
创始人
2026-05-14 03:44:23

IT之家 5 月 13 日消息,小米技术今日正式发布并开源 Xiaomi OneVL 一步式潜空间语言视觉推理框架。

官方表示,该模型在业内率先实现 VLA、世界模型、潜空间推理等多个技术路线的统一,在具备 XLA 模型强悍推理能力的基础上,大幅提升了推理的速度和精度,是行业内具备开创性的方案,在精度上超越显式 CoT、在速度上对齐“仅答案”预测的潜空间 CoT 方案。

过去,VLA 和世界模型是自动驾驶领域两条相对独立的技术路线:VLA 专注于理解场景并输出驾驶动作,世界模型专注于预测未来场景的演变。Xiaomi OneVL 通过潜空间推理,首次将两者统一到同一套框架中。

在涵盖感知、推理与规划的多个主流基准上,Xiaomi OneVL 全面刷新了潜在推理方法的性能上限。

▲ 在 ROADWork、Impromptu、Alpamayo-R1 三项基准上均达到 SOTA,在 NAVSIM 上取得优越性能

同时,Xiaomi OneVL 能为模型决策提供语言和视觉双维度的可解释性 —— 既能用文字说明“为什么这样开”,也能用预测画面展示“接下来会发生什么”。

▲ 为模型决策提供语言以及视觉的可解释性

小米已将Xiaomi OneVL 的模型权重和训练、推理代码全面开源,IT之家汇总链接如下:

  • 技术报告:https://arxiv.org/abs/2604.18486
  • 项目主页:https://Xiaomi-Embodied-Intelligence.github.io/OneVL
  • 开源代码:https://github.com/xiaomi-research/onevl

相关内容

热门资讯

从“AI内化”到“自我进化”,... 从智能体的自进化,到超级个体的涌现,再到超级组织的崛起,最后到平台能力的持续迭代,自我进化,正在成为...
SpaceX斥资550亿美元在... 埃隆·马斯克布局AI芯片制造领域的代价极为高昂。据《纽约时报》和CNBC报道,SpaceX计划向其位...
英伟达押注AlphaGo研发主... 财联社5月14日讯(编辑 史正丞)当地时间周三,英伟达宣布与成立仅数月的英国AI初创公司Ineffa...
威韩牵手 共拓医疗器械产业“蓝... 5月9日下午,在中韩(威海)医疗器械产业合作机会对接会“一对一”洽谈环节,威海美迪森医疗器械股份有限...