英伟达推出开源 AI 框架 Polar，Codex 性能提升近 600%

一句话看懂：英伟达研究团队发布开源 AI 框架 Polar，允许现有代码代理框架（如 Codex）接入一种名为 GRPO 的强化学习训练方法，无需重写原有系统。在 SWE-Bench Verified 测试中，Codex 的 pass@1 得分从 3.8% 提升至 26.4%，提升幅度达 594.74%。

事件核心：发生了什么

2026 年 5 月 28 日，英伟达研究团队正式开源 AI 框架 Polar。该框架并非重新发明一套代码代理系统，而是作为“模型代理”层，架设在现有的代理执行框架（如 Codex、Claude Code、Qwen Code）与推理服务器之间。Polar 的核心技术是引入 Generalized Relative Policy Optimization (GRPO)，这是强化学习中一种通过奖励信号调整模型策略的优化技术，适用于多步骤决策任务。Polar 在初始化、执行和后处理环节做了专门优化，不仅提升性能，还将训练时间缩短约 5.39 倍，同时提高了 GPU 平均利用率。

为什么重要

目前 AI 代理正从单步任务向复杂的长流程任务演进，例如操作代码仓库、浏览器或与操作系统交互。现有代理框架大多已封装了工具调用、上下文管理和补丁提交等机制，直接将其改造为强化学习环境接口极其困难，且易丢失关键训练信号。Polar 提供了一条低侵入路径：不改变原有框架的执行逻辑，仅在模型 API 边界处插入训练数据采集和策略优化层。这意味着，基于现有成熟代理框架训练更强大的代码模型成为可能，降低了大模型在“智能体”能力上持续进化的工程门槛。对于英伟达而言，Polar 也进一步强化了其 GPU 在 AI 训练基础设施中的生态位。

对用户/开发者/创作者的影响

对于开发者而言，Polar 开源后，可以直接在自己的代码代理系统（如基于 Codex 的调试工具或 CI/CD 流程）中引入强化学习训练，无需从零搭建环境，有望显著提升代码生成、自动修复和补丁提交的准确率。对于配备 AI 代码助手的团队，未来可能看到更可靠的“自动软件开发”能力。对于企业采购方，应关注 Polar 对 GPU 资源的高效利用——在训练效率提升 5 倍以上的情况下，同等规模任务的总算力成本会下降。目前框架已开源，但应用至生产环境仍需评估与现有工具链的兼容性。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，GRPO 方法是否会被其他代理框架（如 Claude Code 或 Qwen Code）主动集成，形成类“Polar 兼容”的生态标准。第二，Polar 在 SWE-Bench 上的高得分能否在真实软件工程场景——而非基准测试——中复现，这关系到开发者的实际信任度。第三，英伟达是否会将 Polar 与旗下 AI Enterprise 或 NeMo 等平台结合，形成付费推理优化服务。另外，开源许可协议细节值得开发者仔细审阅，以避免商用时的合规风险。

来源：AIbase

英伟达推出开源 AI 框架 Polar，Codex 性能提升近 600%