Show HN: 在采用 Codex 交接机制的 Claude 代码框架中进行预算控制

一位重度 AI 编程用户为控制 Claude Code 和 Codex 的使用成本,构建了一套基于定价加权代理的预算监护系统,并通过将警告升级为工作路由(将任务分发给更廉价模型),成功实现从 Max 20× 订阅降至 5× 的降本目标。

Show HN: 在采用 Codex 交接机制的 Claude 代码框架中进行预算控制

一句话看懂:一位重度 AI 编程用户为控制 Claude Code 和 Codex 的使用成本,构建了一套基于定价加权代理的预算监护系统,并通过将警告升级为工作路由(将任务分发给更廉价模型),成功实现从 Max 20× 订阅降至 5× 的降本目标。

事件核心:发生了什么

该用户在 blog.rduffy.uk 上公开了自己 11 天的预算监护系统进化过程。原始动机是能否从 Anthropic 的 Max 20× 订阅降级到 5× 计划。他使用了 cccusage 追踪本地使用数据,发现 2025 年 1 月至 6 月 23 日,真实的生成代币量(输入+输出)从 1 月的 60 万急剧攀升至 6 月的 1.61 亿,半年内增长了约 27 倍。其中 6 月的实际生成工作已超过前五个月总和。

核心方案是创建“价格加权代理”进行每周预算控制,而非简单计数原始代币量。权重设置如下:输入代币权重 1.0,缓存创建代币 1.25,缓存读取代币 0.1(便宜),输出代币 5.0(贵 5 倍),再结合模型比例:Opus 1.0、Sonnet 0.6、Haiku 0.2、Fable 2.0。该代理基于逆向工程推算出订阅容量消耗百分比,关键发现是缓存读取的低权重让循环操作变得危险。

系统经历了多个迭代:v0→v1 从强制压缩改为基于近期燃烧速率的预警模式,避免周一过量使用导致周二被误锁;随后发现了日志重复计数导致代理超标 2.4 倍的问题,增加了去重逻辑;v2→v3 则引入跨供应商治理,包括基于意图分类的 UserPromptSubmit 钩子,直接将工作路由到更经济的模型。

为什么重要

这份案例揭示了 AI 编程助手在真实重度使用场景下的成本管理痛点。用户使用数据清晰显示了不连续性增长:月生成代币量在春夏季从 700 万/月跃升至 1.61 亿/六月,陡峭曲线远超线性预期。这说明在 AI 应用快速融入工作流时,成本结构可能呈现不可预测的指数膨胀。

更重要的是,该解决方案证明了“预算监护”可以变成“工作路由”,变被动防御为主动分配。通过意图分类将高价值但昂贵的任务定向给高端模型(如 Opus),将简单或高并发的请求路由给低成本模型(如 Haiku 或 Codex),这种跨代币与跨供应商的弹性架构,可能成为未来 AI 编程平台标配。

预算代理本身是逆向工程产物,Anthropic 未公开 /usage API 的权重计算方式,因此该方案虽经过实际验证,仍存来自定价模型本身的不确定性。

对用户/开发者/创作者的影响

重度用户:如果你是大量使用 Claude Code 或 Codex 进行编程辅助的开发者,该案例直接证明了从 20× 降至 5× 订阅的可行性,关键在于建立价格感知的预算代理,而非单纯的代币计数;否则仍可能因缓存读取的隐性成本而超出预算。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

开发者团队/企业采购:考虑到用户单人六月的自然使用成本估算已达 11,223 美元,企业若批量部署 AI 编码助手,必须建立类似的多级预算控制与工作路由机制。简单的“无限订阅+代币计数”无法预警不可持续支出,加权代理和意图分类可能是降低 TCO 的必要原则。

API 开发人员:该方案中的去重处理、近期速率投影以及模型间路由逻辑,都是可直接复用的经验教训。尤其是缓存读取权重仅 0.1 但循环滥用可被构造为攻击向量的警示,提醒开发者注意“看似便宜”的 API 调用模式可能隐藏的非线性成本。

值得关注的后续

目前公开信息显示:
1. Anthropic 是否会调整定价透明度?用户基于逆向工程构建代理,若 Anthropic 未来开放 /usage 官方加权方式,将直接影响社区类方案的准确性。
2. Codex 的交接机制能否被更多平台采纳?该用户通过工作路由实现跨模型迁移,这种“预算感知+意图路由”的组合若被社区接受,可能催生类似 AI 编程成本管理的开源中间件。
3. 订阅降级后的实际体验报告何时出现?用户目前只承诺了降级计划,尚未公开 Max 5× 下的实际表现,这才是对预算代理有效性的最终检验。

来源:blog.rduffy.uk

celebrityanime
celebrityanime
文章: 9588

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注