Show HN: AWO – 在隔离的 Git 工作树中运行 Claude 和 Codex

一句话看懂：开发者 Yevgen Stepanoff 开源了一款名为 AWO（Agent Worktree Orchestrator）的本地 Go 命令行工具，能在隔离的 Git 工作树中协调 Anthropic 的 Claude Code 和 OpenAI 的 Codex 完成代码修改任务，并通过确定性验证命令而非 LLM 评判胜劣。这给 AI 辅助编程增加了可审计、可撤销的安全边界，同时利用不同模型的能力差异做交叉验证。

事件核心：发生了什么

根据 GitHub 仓库（github.com/ystepanoff/awo），AWO 的核心设计是：它不会让 AI 代理直接修改用户当前的工作目录，而是在独立的 Git 工作树（worktree）中执行代码变更。AWO 提供了三种运行模式——单代理模式（Single）、作家-审稿人模式（Writer-Reviewer）和竞争模式（Competitive）。例如在竞争模式下，Claude Code 和 Codex 可以对同一个任务并行修改，然后由用户配置的验证命令（如 go test ./...）的退出码来决定哪个方案胜出。AWO 不会自动提交、推送、合并或发起拉取请求，而是输出一个包含运行日志、差异补丁和验证结果的结构化文件夹供人类审查。项目目前要求 Go 1.22+ 构建，依赖 git、Claude CLI 和 Codex CLI 三个独立工具。

为什么重要

主流 AI 编程伴侣通常默认直接修改用户的工作区文件，一旦代理出错或中途中断，很容易留下半成品修改或状态不一致。AWO 通过隔离工作树机制降低了这种“爆炸半径”，更重要的是它引入了“确定性评分”——用测试命令的通过与否，而非再用另一个大模型来评判代码质量。这避免了“用 LLM 评判 LLM 输出”带来的不可复现和偏见问题。它还鼓励在同一任务上对比不同模型的实际工程表现，而不是依赖厂商宣传或主观偏好。对于关注 AI 编程安全性和可审计性的团队，这种设计是一种务实且可落地的补充。

对开发者/团队的影响

如果你已经在工作流中使用 Claude Code 或 Codex，AWO 可以作为一层安全垫，让你在放心让两个模型竞争或接力：你可以选择信任率较高的模型作为写手，另一个作为审稿人，交叉检查逻辑盲点，或将同一个任务交给二者并行，通过测试结果来做选择。项目目前是源码安装，没有后台服务或远程依赖，这意味着它适用于对数据隐私敏感的本地环境。但需要注意：AWO 只编排执行过程，最终是否合并仍需人工决策；而且它要求同时安装并认证两个 CLI 工具，增加了前置配置成本。团队若想采用，需要评估测试覆盖是否足够完善——因为 AWO 的评判全依赖验证命令的退出码，如果测试薄弱，评出的“胜者”可能依然漏洞百出。

值得关注的后续

第一，竞品整合风险：如果 Claude Code 或 Codex 自身内置了类似的安全执行沙箱或多模型对比能力，AWO 存在的价值可能会被稀释。第二，模型适配扩展：项目目前只支持 Claude 和 Codex，但适配层设计为可插拔，如果后续出现更优秀的代码代理（如 Meta 的 Code Llama 工具化版本），能否快速加入将考验社区维护力。第三，实际使用案例：目前公开信息只提供了自包含示例（sample-go-app），缺少长期生产环境的数据——比如在竞争模式下两个模型对同一任务的成功率差异、性能消耗、以及人工审查负担是否会反倒增加，都需要更大规模的实践验证。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

来源：github.com

Show HN: AWO – 在隔离的 Git 工作树中运行 Claude 和 Codex