英伟达推出开源 AI 框架 Polar,Codex 性能提升近 600%

英伟达推出开源 AI 框架 Polar,Codex 性能提升近 600%

英伟达推出开源 AI 框架 Polar,Codex 性能提升近 600%

一句话看懂:英伟达研究团队发布开源 AI 框架 Polar,允许现有代码代理框架(如 Codex)接入一种名为 GRPO 的强化学习训练方法,无需重写原有系统。在 SWE-Bench Verified 测试中,Codex 的 pass@1 得分从 3.8% 提升至 26.4%,提升幅度达 594.74%。

事件核心:发生了什么

2026 年 5 月 28 日,英伟达研究团队正式开源 AI 框架 Polar。该框架并非重新发明一套代码代理系统,而是作为“模型代理”层,架设在现有的代理执行框架(如 Codex、Claude Code、Qwen Code)与推理服务器之间。Polar 的核心技术是引入 Generalized Relative Policy Optimization (GRPO),这是强化学习中一种通过奖励信号调整模型策略的优化技术,适用于多步骤决策任务。Polar 在初始化、执行和后处理环节做了专门优化,不仅提升性能,还将训练时间缩短约 5.39 倍,同时提高了 GPU 平均利用率。

为什么重要

目前 AI 代理正从单步任务向复杂的长流程任务演进,例如操作代码仓库、浏览器或与操作系统交互。现有代理框架大多已封装了工具调用、上下文管理和补丁提交等机制,直接将其改造为强化学习环境接口极其困难,且易丢失关键训练信号。Polar 提供了一条低侵入路径:不改变原有框架的执行逻辑,仅在模型 API 边界处插入训练数据采集和策略优化层。这意味着,基于现有成熟代理框架训练更强大的代码模型成为可能,降低了大模型在“智能体”能力上持续进化的工程门槛。对于英伟达而言,Polar 也进一步强化了其 GPU 在 AI 训练基础设施中的生态位。

对用户/开发者/创作者的影响

对于开发者而言,Polar 开源后,可以直接在自己的代码代理系统(如基于 Codex 的调试工具或 CI/CD 流程)中引入强化学习训练,无需从零搭建环境,有望显著提升代码生成、自动修复和补丁提交的准确率。对于配备 AI 代码助手的团队,未来可能看到更可靠的“自动软件开发”能力。对于企业采购方,应关注 Polar 对 GPU 资源的高效利用——在训练效率提升 5 倍以上的情况下,同等规模任务的总算力成本会下降。目前框架已开源,但应用至生产环境仍需评估与现有工具链的兼容性。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,GRPO 方法是否会被其他代理框架(如 Claude Code 或 Qwen Code)主动集成,形成类“Polar 兼容”的生态标准。第二,Polar 在 SWE-Bench 上的高得分能否在真实软件工程场景——而非基准测试——中复现,这关系到开发者的实际信任度。第三,英伟达是否会将 Polar 与旗下 AI Enterprise 或 NeMo 等平台结合,形成付费推理优化服务。另外,开源许可协议细节值得开发者仔细审阅,以避免商用时的合规风险。

来源:AIbase

celebrityanime
celebrityanime
文章: 4101

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注