Show HN: 在采用 Codex 交接机制的 Claude 代码框架中进行预算控制

一句话看懂：一位重度 AI 编程用户为控制 Claude Code 和 Codex 的使用成本，构建了一套基于定价加权代理的预算监护系统，并通过将警告升级为工作路由（将任务分发给更廉价模型），成功实现从 Max 20× 订阅降至 5× 的降本目标。

事件核心：发生了什么

该用户在 blog.rduffy.uk 上公开了自己 11 天的预算监护系统进化过程。原始动机是能否从 Anthropic 的 Max 20× 订阅降级到 5× 计划。他使用了 cccusage 追踪本地使用数据，发现 2025 年 1 月至 6 月 23 日，真实的生成代币量（输入+输出）从 1 月的 60 万急剧攀升至 6 月的 1.61 亿，半年内增长了约 27 倍。其中 6 月的实际生成工作已超过前五个月总和。

核心方案是创建“价格加权代理”进行每周预算控制，而非简单计数原始代币量。权重设置如下：输入代币权重 1.0，缓存创建代币 1.25，缓存读取代币 0.1（便宜），输出代币 5.0（贵 5 倍），再结合模型比例：Opus 1.0、Sonnet 0.6、Haiku 0.2、Fable 2.0。该代理基于逆向工程推算出订阅容量消耗百分比，关键发现是缓存读取的低权重让循环操作变得危险。

系统经历了多个迭代：v0→v1 从强制压缩改为基于近期燃烧速率的预警模式，避免周一过量使用导致周二被误锁；随后发现了日志重复计数导致代理超标 2.4 倍的问题，增加了去重逻辑；v2→v3 则引入跨供应商治理，包括基于意图分类的 UserPromptSubmit 钩子，直接将工作路由到更经济的模型。

为什么重要

这份案例揭示了 AI 编程助手在真实重度使用场景下的成本管理痛点。用户使用数据清晰显示了不连续性增长：月生成代币量在春夏季从 700 万/月跃升至 1.61 亿/六月，陡峭曲线远超线性预期。这说明在 AI 应用快速融入工作流时，成本结构可能呈现不可预测的指数膨胀。

更重要的是，该解决方案证明了“预算监护”可以变成“工作路由”，变被动防御为主动分配。通过意图分类将高价值但昂贵的任务定向给高端模型（如 Opus），将简单或高并发的请求路由给低成本模型（如 Haiku 或 Codex），这种跨代币与跨供应商的弹性架构，可能成为未来 AI 编程平台标配。

预算代理本身是逆向工程产物，Anthropic 未公开 /usage API 的权重计算方式，因此该方案虽经过实际验证，仍存来自定价模型本身的不确定性。

对用户/开发者/创作者的影响

重度用户：如果你是大量使用 Claude Code 或 Codex 进行编程辅助的开发者，该案例直接证明了从 20× 降至 5× 订阅的可行性，关键在于建立价格感知的预算代理，而非单纯的代币计数；否则仍可能因缓存读取的隐性成本而超出预算。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

开发者团队/企业采购：考虑到用户单人六月的自然使用成本估算已达 11,223 美元，企业若批量部署 AI 编码助手，必须建立类似的多级预算控制与工作路由机制。简单的“无限订阅+代币计数”无法预警不可持续支出，加权代理和意图分类可能是降低 TCO 的必要原则。

API 开发人员：该方案中的去重处理、近期速率投影以及模型间路由逻辑，都是可直接复用的经验教训。尤其是缓存读取权重仅 0.1 但循环滥用可被构造为攻击向量的警示，提醒开发者注意“看似便宜”的 API 调用模式可能隐藏的非线性成本。

值得关注的后续

目前公开信息显示：
1. Anthropic 是否会调整定价透明度？用户基于逆向工程构建代理，若 Anthropic 未来开放 /usage 官方加权方式，将直接影响社区类方案的准确性。
2. Codex 的交接机制能否被更多平台采纳？该用户通过工作路由实现跨模型迁移，这种“预算感知+意图路由”的组合若被社区接受，可能催生类似 AI 编程成本管理的开源中间件。
3. 订阅降级后的实际体验报告何时出现？用户目前只承诺了降级计划，尚未公开 Max 5× 下的实际表现，这才是对预算代理有效性的最终检验。

来源：blog.rduffy.uk

Show HN: 在采用 Codex 交接机制的 Claude 代码框架中进行预算控制

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

直接从像素到单词：这个原生大模型统一单图、多图、视频和空间智能

从预测到干预，Aether AI 为什么押注因果世界模型？

端侧跑大模型，现在也太简单了

发表回复取消回复