全球首款全开源全模态物理AI大模型Cosmos3 发布,英伟达联手行业巨头成立宇宙联盟

全球首款全开源全模态物理AI大模型Cosmos3 发布,英伟达联手行业巨头成立宇宙联盟

全球首款全开源全模态物理AI大模型Cosmos3 发布,英伟达联手行业巨头成立宇宙联盟

一句话看懂:英伟达于6月1日发布全球首款全开源、全模态物理AI大模型Cosmos3,旨在将物理AI的训练和评估周期从数月缩短至数天,并联合多家行业公司成立“宇宙联盟”,推动机器人、自动驾驶等领域的物理世界推理与生成能力。

事件核心:发生了什么

6月1日,英伟达正式推出开源物理AI基础大模型Cosmos3。该模型采用创新的混合Transformer架构,在一个系统内整合了视觉推理、世界生成和动作预测能力。它基于包含数十亿文本、图像、视频、音频和运动轨迹的物理AI数据集训练,能理解和生成跨模态内容,在物理模拟精度上达到行业领先。英伟达同步发布了三个版本:面向二次训练和极致精度的Cosmos3Super、可在数秒内完成高质量视频解析和动作推理的Cosmos3Nano,以及计划中的边缘端实时推理版本Cosmos3Edge。在发布会上,英伟达还与Agile Robots、Black Forest Labs、Generalist、LTX、Runway、Skild AI等公司联合成立了“英伟达宇宙联盟”(NVIDIA Cosmos Coalition)。英伟达创始人兼CEO黄仁勋表示,多模态推理及世界模型的持续突破,标志着物理AI的变革时代已经到来。

为什么重要

长期以来,物理AI面临“真实场景泛化难、仿真框架碎片化、数据有限”的行业痛点。Cosmos3的全开源、全模态特性,为开发者提供了一个统一的底层模型,有望显著降低机器人、自动驾驶等领域的技术门槛和开发成本。其混合Transformer架构将推理与生成能力结合,在多项主流物理AI基准测试中(如Artificial Analysis、Physics-IQ、RoboLab)均位列开源模型榜首,意味着开源方案在物理世界模拟和动作规划能力上已接近或达到闭源水平。联盟的成立也表明英伟达正从单纯提供算力,转向构建涵盖模型、工具和生态的物理AI平台。

对用户/开发者/创作者的影响

对于AI开发者而言,Cosmos3的开源属性使其可在自有算力上进行二次训练和微调,尤其适合机器人公司、自动驾驶研发团队和仿真平台建设者,能将项目周期从数月压缩至数天。创作者和内容生成领域用户,可评估其在文本到视频生成、物理现象模拟等方面的效果,相比纯视觉模型,其动作轨迹与交互规则理解能力更为扎实。中小企业和研究机构无需从零构建物理AI底层能力,可直接基于Cosmos3Super或Cosmos3Nano进行应用开发,降低研发投入。但需注意,当前Nano版本强调快速推理,Edge版本尚未正式发布,高精度场景仍需使用Super版本,资源消耗不低。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,Cosmos3Edge版本的具体上线时间和硬件适配范围,将决定边缘端实时物理AI应用能否落地。第二,英伟达宇宙联盟是否能形成有效的开源生态协作机制,以及是否有其他芯片厂商(如AMD、高通)或模型公司推出对标竞品,将影响开发者社区的选择。第三,物理AI大模型在实际复杂场景(如非结构化工厂环境、开放道路)中的泛化表现,仍需更多第三方独立测评验证。

来源:AIbase

celebrityanime
celebrityanime
文章: 4942

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注