
一句话看懂:智源研究院在2026年智源大会上系统性定义了世界模型的四大技术分类,并发布了全球首款通用世界基座模型“悟界·Physis-v0.1”和具身大脑“悟界·RoboBrain Orca”,试图为混乱的“世界模型”概念厘清边界,为从数字AGI走向物理AGI提供一条可验证的技术路线。
事件核心:发生了什么
2026年智源大会以“世界模型正本清源”为核心主题。智源研究院院长王仲远提出,当前AI正从大语言模型向多模态大模型再向世界模型演进,核心是从“预测下一个Token”切换为“预测下一个物理状态”。
大会上,智源首次将世界模型技术路线分为四类:第一类以语言为中心(如VLM,学到的是语言描述而非物理后果);第二类以像素为中心(如Sora,学到的是像素变化);第三类以三维结构为中心(如3D重建,但几何结构不等于物理状态);第四类以视觉表征为中心(如JEPA,但嵌入演化不等于物理规律)。智源认为,真正物理世界模型应超越以上单一维度。
基于此判断,智源发布了两款核心产品:悟界·Physis-v0.1是全球首款通用世界基座模型,通过物理隐空间表征替代传统像素/帧预测,支持50+复杂物理场景的长程推理,具备物理一致性、动作因果性等能力;悟界·RoboBrain Orca则是以“下一个物理状态预测”为核心的具身大脑,能同时生成语言思考、视觉预测与动作决策,实现“想、看、动”三位一体。此外,多模态模型悟界·Emu3已于2026年1月登上Nature正刊。
大会还展示了面向医疗、科研、个人及生物安全的智能体矩阵,包括心脏磁共振辅助诊断智能体BAAI Cardiac Agent、自主研究智能体AREX、个人专属智能体SoulAgent,以及用于主动模拟生物安全攻击路径的风险发现智能体。
为什么重要
自Sora、VLA等概念被提出后,“世界模型”一词被广泛滥用,技术路线极度分散。智源此次“正本清源”的核心意义在于:用分类法将争议转化为可讨论的技术分层,使行业不再笼统争论“什么是世界模型”,而是能针对具体路线评估优劣。其发布的Physis-v0.1摒弃了文本或像素空间,转向物理隐空间,本质上是将AI从“拟合数据分布”转向“建模物理因果”,是通往具身智能和工业仿真等严肃场景的关键一步。
此外,智源在多模态、脑科学、生物计算、智能体安全等领域的同期成果(如Brainμ1.0神经科学大模型、OpenComplex2.5药物发现模型),显示出其从学术定义到工程落地的闭环能力,可能影响国内AI科研与开源社区的技术走向。
对用户/开发者/创作者的影响
开发者与具身智能创业者:Physis-v0.1和RoboBrain Orca提供了从“预测下一个动作”到“预测下一个物理状态”的底层基座,这意味着机器人或仿真系统不再依赖大量标定好的规则,而是能直接对物理世界进行因果推理。目前公开信息显示模型支持50+场景长程推理,有望降低具身智能在物流、酒店服务等场景中的部署成本。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
严肃工业与科研用户:Physis-v0.1强调通用基座能力,可应用于严肃工业仿真和科学研究,其物理隐空间表征有望纠正当前AI仿真“看起来真但物理上假”的行业通病。BAAI Cardiac Agent依托3万条影像-文本配对数据,诊断AUC超0.93,表明AI医疗智能体已接近顶尖医生水平,对心脏影像辅助诊断领域有直接应用价值。
AI安全与政策研究者:智源主动展示的“有害蛋白获取风险发现智能体”打通了干湿实验闭环,提前暴露了AI agent在生物知识获取中的脆弱性。这对监管部门和AI供应商的合规评估提出了新课题:防滥用机制需要从被动响应转向主动模拟。
值得关注的后续
- Physis-v0.1是否开源及何时开放API:作为全球首款通用世界基座模型,其开放策略将直接影响国内具身智能、工业仿真生态的底层基础设施选择。若开源,可能加速物理AI的国产替代路线。
- 企业竞品路线是否分化:智源的四大分类法本质上是将主流厂商(如Sora派、VLA派、3D重建派)进行了“标签化”,后续谷歌、Meta、英伟达等势力是否会明确站队或推出类似隐空间模型,值得观察。
- 脑科学大模型落地效率:Brainμ1.0已用于支撑“记忆-睡眠”调控机制研究并登刊Science,但其万亿级神经科学数据Token化平台能否降低阿尔兹海默症等疾病的辅助诊断成本,仍需商业化验证。
来源:Readhub · AI


