CVPR 2026,英伟达特斯拉Waymo一块听中国公司讲物理AI

CVPR 2026,英伟达特斯拉Waymo一块听中国公司讲物理AI

CVPR 2026,英伟达特斯拉Waymo一块听中国公司讲物理AI

一句话看懂:在2026年CVPR首次设立的“具身智能基座模型部署研讨会”上,小鹏汽车作为唯一受邀的中国企业,与特斯拉、英伟达、Waymo同台,完整展示了其物理世界基座模型的技术图谱,并公布了第二代VLA模型量产首月的关键运营数据——搭载车型辅助驾驶里程占比突破50%。

事件核心:发生了什么

本次CVPR 2026研讨会中,小鹏通用智能中心负责人刘先明发表了演讲,首次系统化公开了小鹏世界模型的技术栈。这套技术栈基于团队近期发表的X-World、X-Foresight、X-Cache等系列论文,核心思路是:将人类意图(稀疏监督信号)与物理世界的密集预测(每一帧画面、每次运动)并行训练,使模型同时理解“怎么做”和“世界会怎么变”。小鹏明确表示,其物理世界基座模型既是第二代VLA,也是世界模型,并非二选一。具体数据方面:截至今年3月的一年内,小鹏智算集群单GPU训练效率提升1010%,单任务训练效率暴涨4360%;车端自研组合(第二代VLA+图灵芯片)将推理时延压缩至80毫秒,算力利用率提升至82.5%。

为什么重要

物理AI是2026年AI赛道最火的概念,但在此之前,行业普遍存在技术路线之争:VLA和世界模型到底选哪个?小鹏的演讲实际上终结了这一二元对立,提出了一套协同进化的工程方案。同时,它首次在量产车端验证了自动驾驶Scaling Law——十亿级参数模型、超4万亿Token训练、平均每天迭代4版模型,这些量级数据说明,物理AI的军备竞赛已从单点技术突破进入系统性工程能力比拼。同行(特斯拉、Waymo、英伟达)愿意坐下来听,也侧面印证了小鹏并非在造概念,而是拿出了可部署、可验证的完整链路。

对用户/开发者/创作者的影响

对智能汽车用户而言,这意味着高阶智驾正在从“可选配置”变成真正的刚需——小鹏第二代VLA推送首月,用户主动使用辅助驾驶的里程占比就超过了50%,体验提升直接导致了购买决策的倾斜(调研显示超60%的车主将“智能驾驶能力”排在购车因素前三位)。对从事自动驾驶、具身智能或机器人开发的工程师和研究者来说,小鹏给出的技术路径提供了可参照的实践范式:如何将稀疏的人类意图信号与密集的物理预测信号融合,如何用世界模型做闭环仿真和数据生成,以及如何在端侧做极致推理加速(X-Cache减少约七成重复计算、实现2.7倍加速)。此外,小鹏明确表示世界模型具备跨域迁移能力,这意味着其技术平台未来也可能延伸到机器人、飞行汽车等场景,相关开发者可提前关注其开源或合作动态。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

1. X-mind论文何时发布?刘先明透露即将发表的X-mind论文旨在解决模型“主动思考”的可解释性问题,这直接关乎自动驾驶的安全审核与用户信任,一旦公开可能成为行业新的技术标杆。

2. 其他玩家是否会跟进协同进化路线?特斯拉、Waymo、英伟达都参加了同一研讨会,未来大概率会发布自家世界模型与VLA结合的技术方案,竞争格局可能从路线之争转向工程细节之争。

3. 跨域迁移是否落地?小鹏的物理世界基座模型是否在机器人或飞行汽车上开始测试,将检验其“不是教AI开车而是教AI看懂物理世界”的叙事真实性,目前公开信息显示并未披露具体迁移案例。

来源:量子位 · 每日最新

celebrityanime
celebrityanime
文章: 5583

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注