
一句话看懂:Patrick C Toulme 在 X 上分享了其设计的新一代 AI 代理(Agent)框架的核心特性:不依赖特定跑步者(即不绑定具体 LLM 后端),优先支持 Codex 和 Claude Code 两大编程代理,同时内置离线运行器用于测试,并通过强制记录每次工具调用来确保代理真正执行操作,而非仅生成工具逻辑但未实际运行。
事件核心:发生了什么
Patrick C Toulme 于 2026 年 6 月 29 日发布了一则技术思考推文,描述了他正在构建的 AI 代理系统的设计原则。核心要点包括:
1. “Runner-agnostic by design”:系统架构与具体的“跑步者”解耦,这里的“跑步者”可理解为模型调用后端或执行引擎,意味着用户可在不修改系统核心的情况下切换底层 LLM 或执行环境。
2. Codex 和 Claude Code 作为一等公民:这两款主流代码生成/代理工具被系统原生支持,成为默认的“跑步者”。Codex 是 GitHub 的代码辅助功能,Claude Code 是 Anthropic 的编程代理,显示系统意图优先服务编程场景。
3. 离线运行器用于测试:提供不连接云端 API 的本地执行环境,允许开发者在无网络或安全限制下验证代理行为,降低调试成本。
4. 工具调用日志与胜利条件:每次由 LLM 生成的工具调用(如调用数据库、执行代码)都会被系统记录。系统设计“胜利条件”(harness win)要求代理必须实际调用并执行该工具,而非仅输出工具调用文本而不触发动作。
为什么重要
该设计展示了对当前 AI 代理开发中两个核心痛点的回应:
一是与具体模型绑定的解耦。目前多数代理框架高度依赖特定模型(如 GPT-4 或 Claude 3.5),切换模型需大量重写适配。此系统通过与“跑步者”解耦,实现了跨越 Codex 和 Claude Code 的无缝切换,可能是未来代理框架的实用范式。
二是对代理行为的可验证性要求。当前 LLM 常会“假装”调用工具——模型输出类似调用工具的文本,但并未真正触发函数执行。强制要求代理实际执行工具才为胜利,将极大提高代理执行过程的可靠性,尤其在自动化测试、API 编排等场景中意义明显。
对用户/开发者/创作者的影响
对开发者而言,这种架构直接降低了集成成本:无需为不同 API 或运行时重写业务逻辑,切换模型只需替换“跑步者”配置。对需要构建可靠自动化工作流的团队(如 CI/CD 管道、代码审查助手),强制工具调用执行的胜利条件将帮助避免模型幻觉导致的无效输出。对AI 代理框架设计者而言,离线运行器的存在提供了一个安全的沙盒测试环境,可加速迭代试验。不过,目前该推文仅披露了设计思想,尚未发布完整代码或开源仓库。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
1. 开源发布与否:Patrick 是否会将此设计实现为开源项目,或者仅作为内部框架。若开源,可能成为替代 LangChain、AutoGPT 等工具的轻量方案候选。
2. 对 Codex 和 Claude Code 之外的扩展性:系统目前仅提及这两个“一等公民”,未来是否支持 OpenAI 的 GPT-4o、Google Gemini 等模型,将决定其生态覆盖范围。
3. 离线运行器的能力边界:离线环境能否完整模拟商用 API 的上下文窗口长度和工具调用能力,是开发者实际采用的基础。
![[Claude Code] [开源]Janus — 为 AI 编程助手打造的外部认知操作系统](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_5-1026-768x403.jpg)

