20 亿小参数赶超英伟达旗舰模型,智元 GE 2.0 世界模型「裸考」登顶国际权威榜单

20 亿小参数赶超英伟达旗舰模型,智元 GE 2.0 世界模型「裸考」登顶国际权威榜单

20 亿小参数赶超英伟达旗舰模型,智元 GE 2.0 世界模型「裸考」登顶国际权威榜单

一句话看懂:智元机器人推出的世界模型 GE 2.0,凭借仅 20 亿(2B)参数的轻量化模型,在全球权威评测基准“World Arena”的“感知与动作响应”榜单中击败英伟达等竞争对手,拿下第一。这表明,在人形机器人领域,小参数模型的性能未必逊于超大参数模型。

事件核心:发生了什么

据格隆汇 5 月 30 日报道,智元机器人自研的世界模型 Genie Envisioner-Sim 2.0(简称 GE 2.0)在全球评测基准“World Arena”(世界竞技场)的“感知与动作响应”榜单中位列第一。该榜单汇集了英伟达的最新模型 DreamDojo、以及清华联合斯坦福的 Ctrl-World 团队等顶尖参赛者。GE 2.0 最终凭借其综合表现夺冠。值得注意的是,GE 2.0 仅使用了 20 亿(2B)参数,在性能上超越了英伟达、微软等采用超大参数规模的旗舰模型。智元方面透露,这验证了轻量化模型在人形机器人应用中具备不亚于超大参数模型的适配性。

为什么重要

这次夺冠有两点突破:一是“小参数打败大参数”。过去行业普遍认为模型参数越大,能力越强,但 GE 2.0 证明了在人形机器人场景下,通过更优的网络架构或训练策略,20 亿参数就能达到甚至超越业界更高成本、更大算力堆出的结果,这直接冲击了“越大越好”的路径依赖。二是“裸考”含义——GE 2.0 在没有针对该评测做过针对性优化(类似于未刷题)的情况下直接参评并登顶,表明其能力泛化性强、鲁棒性好,而不是单纯为了刷榜。这对人形机器人的产业化落地有现实意义:小模型部署成本更低,功耗更小,更容易在实体机器人上实时运行,有助于加速商业化进程。

对用户/开发者/创作者的影响

对于开发者而言,智元 GE 2.0 的轻量化路线提供了一个可借鉴的范式:在人形机器人或具身智能场景下,不必盲目追求数亿或千亿级大模型,小参数模型同样可以高效解决感知-动作响应问题。这降低了嵌入式开发、边缘计算场景的模型部署门槛。对于普通用户,轻量化模型意味着未来消费级机器人更有可能具备实时、低延迟的交互能力,价格也可能更低。对于 AI 创作者,尤其是开发仿真环境或机器人应用的团队,可以通过参考 GE 2.0 的思路,缩小模型规模,从而节省推理成本,提高产品迭代速度。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,GE 2.0 是否会开源或开放 API 接口。智元目前主要专注于机器人本体业务,若模型能向开发者社区开放,将极大推动国内人形机器人的软件生态建设。第二,英伟达等团队是否会调整自家模型的技术路线。英伟达 DreamDojo 同样是世界模型方向的重要尝试,被小参数模型反超后,其后续版本或在参数规模上转向更高效架构。第三,智元 GE 2.0 能否在更广泛的实际应用场景中复制评测中的优秀表现。目前公开信息显示,GE 2.0 仅在特定评测榜单中夺冠,其在真实环境、复杂动作交互下的稳健性有待持续披露。

来源:Readhub · AI

celebrityanime
celebrityanime
文章: 4597

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注