Harness 工程:在“代理优先”的世界中运用 Codex

Harness 工程:在“代理优先”的世界中运用 Codex

Harness 工程:在“代理优先”的世界中运用 Codex

一句话看懂:OpenAI 研究团队用 Codex 智能体(基于 GPT-5)在零行人工代码的情况下,三个月内构建并交付了一款拥有百万行代码的内部软件产品。这不仅是技术演示,更是一次“开发范式”实验——证明了当工程师从“写代码”转向“设计环境和反馈回路”,工程速度可以提升约 10 倍。

事件核心:发生了什么

2025 年 8 月底,OpenAI 技术团队成员 Ryan Lopopolo 启动了一项极端实验:从一个空 Git 仓库开始,完全依靠 Codex 智能体编写包括应用逻辑、测试、CI 配置、文档、可观测性工具和内部基础设施在内的所有代码。整个开发周期约五个月,最终仓库积累了约 100 万行代码,项目合并了约 1500 个 Pull Request。初期团队仅 3 人,后扩至 7 人,平均每人每天产出 3.5 个 PR,且速度未下降。产品已拥有内部日常用户和外部 Alpha 测试者。团队坚持的核心原则是:人类负责“引导和确认”,所有代码由智能体生成。

为什么重要

这一实验挑战了当前主流的“AI 辅助开发”模式,转而验证“代理优先”(Agent-First)工程方法。在传统模式下,AI 仅作为编码辅助工具,人类仍主导大部分设计和调试。而 Harness 工程表明,当环境足够规范化、意图明确、反馈机制完善后,智能体可以成为主要的生产力单元。这加速了从“AI 写代码”到“AI 构建完整软件系统”的技术路线演进。同时,GPT-5 在 Codex CLI 中的实际表现,也首次在大规模、长时间的真实产品构建中得到了公开验证。

对用户/开发者/创作者的影响

对软件开发者而言,这预示未来核心工作将从“编写每一行代码”转向“设计系统抽象、构建可被智能体理解的环境,以及制定可靠的验证流程”。对工具和平台开发者来说,需要关注如何让底层基础设施(如 CI/CD、可观测性工具、UI 框架)原生支持智能体操作,例如项目中的“按 git worktree 可启动应用”让 Codex 能直接驱动多个实例。对于 AI 创业者,这一实验提供了可复用的参考:通过构建“代理友好”的开发环境,团队可大幅降低手动编码的人力成本。

值得关注的后续

1. 产品落地节奏:目前该产品仍为内部 Beta 和外部 Alpha 测试阶段,OpenAI 是否会在未来将其作为独立产品或平台开放给开发者生态,尚不明朗。2. Codex 智能体能力边界:实验沿用 GPT-5 模型和 Codex CLI 工具,当面对更大规模、更复杂的多团队协作项目时,智能体的环境感知能力和反馈循环效率是否仍能维持 10 倍提速还需验证。3. 竞品跟进:这一案例可能促使 Google、Anthropic、Meta 等公司加速推进类似“代理优先”的开发测试,尤其是在内部研发工具链方向,出现更多面向智能体而非面向人类工程师的抽象层设计。

来源:openai.com

celebrityanime
celebrityanime
文章: 6141

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注