设计上与跑步者无关。 Codex 和 Claude Code 是一流的，还有用于测试的离线运行器。每个生成的工具调用都会被记录，因此“利用胜利”可能要求代理实际使用该工具 – 而不仅仅是……

一句话看懂：Patrick C Toulme 在 X 上分享了其设计的新一代 AI 代理（Agent）框架的核心特性：不依赖特定跑步者（即不绑定具体 LLM 后端），优先支持 Codex 和 Claude Code 两大编程代理，同时内置离线运行器用于测试，并通过强制记录每次工具调用来确保代理真正执行操作，而非仅生成工具逻辑但未实际运行。

事件核心：发生了什么

Patrick C Toulme 于 2026 年 6 月 29 日发布了一则技术思考推文，描述了他正在构建的 AI 代理系统的设计原则。核心要点包括：
1. “Runner-agnostic by design”：系统架构与具体的“跑步者”解耦，这里的“跑步者”可理解为模型调用后端或执行引擎，意味着用户可在不修改系统核心的情况下切换底层 LLM 或执行环境。
2. Codex 和 Claude Code 作为一等公民：这两款主流代码生成/代理工具被系统原生支持，成为默认的“跑步者”。Codex 是 GitHub 的代码辅助功能，Claude Code 是 Anthropic 的编程代理，显示系统意图优先服务编程场景。
3. 离线运行器用于测试：提供不连接云端 API 的本地执行环境，允许开发者在无网络或安全限制下验证代理行为，降低调试成本。
4. 工具调用日志与胜利条件：每次由 LLM 生成的工具调用（如调用数据库、执行代码）都会被系统记录。系统设计“胜利条件”（harness win）要求代理必须实际调用并执行该工具，而非仅输出工具调用文本而不触发动作。

为什么重要

该设计展示了对当前 AI 代理开发中两个核心痛点的回应：
一是与具体模型绑定的解耦。目前多数代理框架高度依赖特定模型（如 GPT-4 或 Claude 3.5），切换模型需大量重写适配。此系统通过与“跑步者”解耦，实现了跨越 Codex 和 Claude Code 的无缝切换，可能是未来代理框架的实用范式。
二是对代理行为的可验证性要求。当前 LLM 常会“假装”调用工具——模型输出类似调用工具的文本，但并未真正触发函数执行。强制要求代理实际执行工具才为胜利，将极大提高代理执行过程的可靠性，尤其在自动化测试、API 编排等场景中意义明显。

对用户/开发者/创作者的影响

对开发者而言，这种架构直接降低了集成成本：无需为不同 API 或运行时重写业务逻辑，切换模型只需替换“跑步者”配置。对需要构建可靠自动化工作流的团队（如 CI/CD 管道、代码审查助手），强制工具调用执行的胜利条件将帮助避免模型幻觉导致的无效输出。对AI 代理框架设计者而言，离线运行器的存在提供了一个安全的沙盒测试环境，可加速迭代试验。不过，目前该推文仅披露了设计思想，尚未发布完整代码或开源仓库。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

1. 开源发布与否：Patrick 是否会将此设计实现为开源项目，或者仅作为内部框架。若开源，可能成为替代 LangChain、AutoGPT 等工具的轻量方案候选。
2. 对 Codex 和 Claude Code 之外的扩展性：系统目前仅提及这两个“一等公民”，未来是否支持 OpenAI 的 GPT-4o、Google Gemini 等模型，将决定其生态覆盖范围。
3. 离线运行器的能力边界：离线环境能否完整模拟商用 API 的上下文窗口长度和工具调用能力，是开发者实际采用的基础。

来源：@PatrickToulme

设计上与跑步者无关。 Codex 和 Claude Code 是一流的，还有用于测试的离线运行器。每个生成的工具调用都会被记录，因此“利用胜利”可能要求代理实际使用该工具 – 而不仅仅是……

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

[Claude Code] [开源]Janus — 为 AI 编程助手打造的外部认知操作系统

你真的不应该将错误复制粘贴到克劳德代码中

使用人工智能：一个具体的例子

发表回复取消回复