GitHub 通过每日审计与 MCP 精简，将 Agent 工作流 Token 成本最高降低 62%

一句话看懂：GitHub 在 CI 环境中构建了一套“审计-优化”闭环，通过每日自动分析 Token 消耗并精简未被使用的 MCP 工具定义，将多个生产工作流的等效 Token 成本降低了 37% 至 62%，并已将相关工具作为 CLI 组件开放。

事件核心：发生了什么

GitHub 在其内部 CI 工作流中引入了两个 Agent 驱动的自动优化流程。一个“每日 Token 使用审计器”负责按工作流汇总 LLM 调用的 Token 成本，标记异常；另一个“每日 Token 优化器”则读取相关代码和日志，自动创建 GitHub Issue 并提出具体优化建议。团队引入了“等效 Token（ET）”指标——将输出 Token 按 4 倍权重、缓存读取 Token 按 0.1 倍权重计算，再按模型（Haiku 0.25 倍、Sonnet 1.0 倍、Opus 5.0 倍）加权——使得不同模型间的成本变化可直接比较。

实践中最有效的优化手段是精简 MCP 工具配置。GitHub MCP Server 包含约 40 个工具，完整 Schema 在每次请求中额外增加 10 KB 至 15 KB。仅删除冒烟测试工作流中未使用的工具定义，每次调用上下文就减少了 8 KB 至 12 KB。另一个改动是将 Pull Request Diff 和文件内容获取从 MCP 调用改为直接使用 gh CLI 预下载，避免了认证 Token 暴露。效果上，Auto-Triage Issues 工作流在 109 次运行中实现了 62% 的 ET 降幅，Security Guard 降低 43%，Smoke Claude 降低 59%，每日社区归因改善 37%。唯一反向变动的 Contribution Check 因负载变化（处理更大 PR）导致 ET 增加 5%。但 GitHub 也指出，在“每日社区归因”中，8 个未使用工具被移除后 ET 未下降，因为工具清单在该工作流中只占上下文的极小部分。

为什么重要

这项工作为所有在 CI 环境中使用 LLM Agent 的团队提供了一个可复用的成本控制框架。当前许多定时运行的自动化 Agent 工作流存在“隐蔽的成本累积”问题——每次调用看似微小，但长期运行后后台消耗惊人。GitHub 的创新在于构建了“审计-优化”闭环，将代理层的可观测性与能够自动创建 Issue 的优化 Agent 结合起来，打破了传统手动排查的成本管理方式。此外，“等效 Token”指标的设计思路（对输出和缓存加权、按模型调整系数）也为行业提供了一个跨模型成本对比的实用参考。

对用户/开发者/创作者的影响

对于使用 GitHub Actions、Copilot CLI 或 Codex CLI 的开发者而言，GitHub 已将 Auditor 和 Optimiser 作为 gh-aw CLI 的组成部分开放。这意味着任何团队都可以在自己的 CI 工作流中引入类似的自动化成本审计。操作上，开发者需要为所有 Agent 调用统一配置 API 代理，并生成 token-usage.jsonl 文件。值得注意的是，MCP 精简的效果取决于具体工作流——如果工具定义是上下文的主要构成，精简会非常有效；否则收益有限。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

GitHub 表示下一阶段将转向“工作流组合层面”的分析，寻找多个工作流之间重复读取的数据和可共享的中间产物，这可能会进一步降低 Agent 工作流的整体运行成本。目前公开信息显示，Anthropic 和 OpenAI 已提供 Prompt 缓存功能，LangChain 支持基于 Callback 的 Token 追踪，GitHub 的方法是否会被更广泛地整合进这些平台或成为 CI 领域的新标准，值得持续观察。此外，随着更多团队采用开源 MCP 协议，精简 MCP 工具定义的做法可能衍生出自动化的“Schema 压缩”工具。

来源：InfoQ CN

GitHub 通过每日审计与 MCP 精简，将 Agent 工作流 Token 成本最高降低 62%