
GitHub 通过每日审计与 MCP 精简,将 Agent 工作流 Token 成本最高降低 62%
一句话看懂:GitHub 在 CI 环境中构建了一套“审计-优化”闭环,通过每日自动分析 Token 消耗并精简未被使用的 MCP 工具定义,将多个生产工作流的等效 Token 成本降低了 37% 至 62%,并已将相关工具作为 CLI 组件开放。
事件核心:发生了什么
GitHub 在其内部 CI 工作流中引入了两个 Agent 驱动的自动优化流程。一个“每日 Token 使用审计器”负责按工作流汇总 LLM 调用的 Token 成本,标记异常;另一个“每日 Token 优化器”则读取相关代码和日志,自动创建 GitHub Issue 并提出具体优化建议。团队引入了“等效 Token(ET)”指标——将输出 Token 按 4 倍权重、缓存读取 Token 按 0.1 倍权重计算,再按模型(Haiku 0.25 倍、Sonnet 1.0 倍、Opus 5.0 倍)加权——使得不同模型间的成本变化可直接比较。
实践中最有效的优化手段是精简 MCP 工具配置。GitHub MCP Server 包含约 40 个工具,完整 Schema 在每次请求中额外增加 10 KB 至 15 KB。仅删除冒烟测试工作流中未使用的工具定义,每次调用上下文就减少了 8 KB 至 12 KB。另一个改动是将 Pull Request Diff 和文件内容获取从 MCP 调用改为直接使用 gh CLI 预下载,避免了认证 Token 暴露。效果上,Auto-Triage Issues 工作流在 109 次运行中实现了 62% 的 ET 降幅,Security Guard 降低 43%,Smoke Claude 降低 59%,每日社区归因改善 37%。唯一反向变动的 Contribution Check 因负载变化(处理更大 PR)导致 ET 增加 5%。但 GitHub 也指出,在“每日社区归因”中,8 个未使用工具被移除后 ET 未下降,因为工具清单在该工作流中只占上下文的极小部分。
为什么重要
这项工作为所有在 CI 环境中使用 LLM Agent 的团队提供了一个可复用的成本控制框架。当前许多定时运行的自动化 Agent 工作流存在“隐蔽的成本累积”问题——每次调用看似微小,但长期运行后后台消耗惊人。GitHub 的创新在于构建了“审计-优化”闭环,将代理层的可观测性与能够自动创建 Issue 的优化 Agent 结合起来,打破了传统手动排查的成本管理方式。此外,“等效 Token”指标的设计思路(对输出和缓存加权、按模型调整系数)也为行业提供了一个跨模型成本对比的实用参考。
对用户/开发者/创作者的影响
对于使用 GitHub Actions、Copilot CLI 或 Codex CLI 的开发者而言,GitHub 已将 Auditor 和 Optimiser 作为 gh-aw CLI 的组成部分开放。这意味着任何团队都可以在自己的 CI 工作流中引入类似的自动化成本审计。操作上,开发者需要为所有 Agent 调用统一配置 API 代理,并生成 token-usage.jsonl 文件。值得注意的是,MCP 精简的效果取决于具体工作流——如果工具定义是上下文的主要构成,精简会非常有效;否则收益有限。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
GitHub 表示下一阶段将转向“工作流组合层面”的分析,寻找多个工作流之间重复读取的数据和可共享的中间产物,这可能会进一步降低 Agent 工作流的整体运行成本。目前公开信息显示,Anthropic 和 OpenAI 已提供 Prompt 缓存功能,LangChain 支持基于 Callback 的 Token 追踪,GitHub 的方法是否会被更广泛地整合进这些平台或成为 CI 领域的新标准,值得持续观察。此外,随着更多团队采用开源 MCP 协议,精简 MCP 工具定义的做法可能衍生出自动化的“Schema 压缩”工具。
来源:InfoQ CN


