Harness 工程：在“代理优先”的世界中运用 Codex

一句话看懂：OpenAI 研究团队用 Codex 智能体（基于 GPT-5）在零行人工代码的情况下，三个月内构建并交付了一款拥有百万行代码的内部软件产品。这不仅是技术演示，更是一次“开发范式”实验——证明了当工程师从“写代码”转向“设计环境和反馈回路”，工程速度可以提升约 10 倍。

事件核心：发生了什么

2025 年 8 月底，OpenAI 技术团队成员 Ryan Lopopolo 启动了一项极端实验：从一个空 Git 仓库开始，完全依靠 Codex 智能体编写包括应用逻辑、测试、CI 配置、文档、可观测性工具和内部基础设施在内的所有代码。整个开发周期约五个月，最终仓库积累了约 100 万行代码，项目合并了约 1500 个 Pull Request。初期团队仅 3 人，后扩至 7 人，平均每人每天产出 3.5 个 PR，且速度未下降。产品已拥有内部日常用户和外部 Alpha 测试者。团队坚持的核心原则是：人类负责“引导和确认”，所有代码由智能体生成。

为什么重要

这一实验挑战了当前主流的“AI 辅助开发”模式，转而验证“代理优先”（Agent-First）工程方法。在传统模式下，AI 仅作为编码辅助工具，人类仍主导大部分设计和调试。而 Harness 工程表明，当环境足够规范化、意图明确、反馈机制完善后，智能体可以成为主要的生产力单元。这加速了从“AI 写代码”到“AI 构建完整软件系统”的技术路线演进。同时，GPT-5 在 Codex CLI 中的实际表现，也首次在大规模、长时间的真实产品构建中得到了公开验证。

对用户/开发者/创作者的影响

对软件开发者而言，这预示未来核心工作将从“编写每一行代码”转向“设计系统抽象、构建可被智能体理解的环境，以及制定可靠的验证流程”。对工具和平台开发者来说，需要关注如何让底层基础设施（如 CI/CD、可观测性工具、UI 框架）原生支持智能体操作，例如项目中的“按 git worktree 可启动应用”让 Codex 能直接驱动多个实例。对于 AI 创业者，这一实验提供了可复用的参考：通过构建“代理友好”的开发环境，团队可大幅降低手动编码的人力成本。

值得关注的后续

1. 产品落地节奏：目前该产品仍为内部 Beta 和外部 Alpha 测试阶段，OpenAI 是否会在未来将其作为独立产品或平台开放给开发者生态，尚不明朗。2. Codex 智能体能力边界：实验沿用 GPT-5 模型和 Codex CLI 工具，当面对更大规模、更复杂的多团队协作项目时，智能体的环境感知能力和反馈循环效率是否仍能维持 10 倍提速还需验证。3. 竞品跟进：这一案例可能促使 Google、Anthropic、Meta 等公司加速推进类似“代理优先”的开发测试，尤其是在内部研发工具链方向，出现更多面向智能体而非面向人类工程师的抽象层设计。

来源：openai.com

Harness 工程：在“代理优先”的世界中运用 Codex