
τ0-WM:最大规模预训练的开源具身世界模型来了
一句话看懂:上海创智学院副教授、智元机器人首席科学家罗剑岚团队发布了全球最大规模的开源预训练具身世界模型 τ0-WM,用了17800小时真机遥操作数据作为预训练主体,彻底打破了“真机数据太贵、只能用于最后微调”的行业惯例。
事件核心:发生了什么
2026年5月31日,罗剑岚团队正式开源 τ0-World Model(τ0-WM),参数量达到5B,预训练数据规模约3万小时。这其中包括17800小时真机遥操作数据(来自双臂机器人、多视角采集)、6500小时UMI数据(不依赖特定机器人平台的通用操作数据)和3000小时人类第一视角EgoCentric数据。τ0-WM 不只是一个能预测未来画面的世界模型,它还融入了测试时计算机制:机器人在执行前,会先对多个候选动作排序、评估和修正,确保选择最优方案。在工具收纳、书包装物、羽毛球装盒、水管接头对接四个长程精细操作任务上,τ0-WM 的平均成功率超过了对标模型π0.5和Fast-WAM。
为什么重要
过去行业认为,具身智能的数据金字塔是:大量互联网视频(无动作标签、最便宜)→ 仿真数据(有动作但sim2real gap大)→ 极少真机遥操作数据(质量最高但成本极高,只能用于微调)。τ0-WM 第一次把真机数据作为预训练主体,并借助模态特定监督掩码,将无动作标签的人类视频、动作空间不匹配的UMI数据统一纳入同一个预训练体系。这验证了罗剑岚团队此前提出的“预训练—真机部署—数据回流—再预训练”数据飞轮正在跑通:真机数据从“后训练耗材”变成了“预训练燃料”。此外,τ0-WM 在推理阶段保留了“显式未来想象”并用于动作筛选,而非像许多世界模型那样为了推理速度直接去掉未来预测模块——这意味着模型思维方式从“动作内部一致性”转向了“关注未来后果”,是具身决策能力的关键跃升。
对用户/开发者/创作者的影响
对机器人研发团队和具身智能开发者而言,τ0-WM 提供了可直接使用的开源预训练基座。其5B参数量说明,大规模真机预训练不再是只属于顶级实验室的秘密武器,开源社区首次获得了带有显著真机数据红利的世界模型。对智元机器人等产品端企业而言,τ0-WM 的能力意味着未来家用、服务、工业等场景的长程精细操作可降低试错成本和部署门槛。不过,目前公开信息显示,τ0-WM 在完全未见的新任务(抽纸巾放进盒子、捡笔放进盒子)上的成功率从裸策略的43%提升到了加测试时计算后的60%——仍有明显提升空间,开发者不能期望“开箱即用”全场景落地,需要结合自身场景做后训练微调。
值得关注的后续
第一,τ0-WM 的测试时计算机制是否会被更多具身世界模型跟进。第二,智元机器人数据飞轮是否继续扩容,罗剑岚团队此前在SOP(规模化采集)和LWD(后训练强化学习)上的积累能否推动更大规模真机预训练。第三,其他具身智能团队是否会调整数据策略,从“依赖仿真数据/人类视频”转向“大规模真机遥操作+跨模态统一训练”的路线。第四,τ0-WM 的GitHub和Huggingface仓库开源后,社区反馈速度和实际部署案例将决定它能否真正成为具身智能领域的可用基础设施。
来源:Readhub · AI


