忘了设限，1 家公司 1 个月在 Claude 烧掉 5 亿美元！—— 当 AI 已经贵到「用不起」

一句话看懂：一家企业客户因未设置员工使用上限，在单月内向 Anthropic 的 Claude 支付了 5 亿美元账单。这一事件暴露了企业 AI 采购中缺乏成本管控的普遍风险，也引发了对大模型推理成本是否已达“不可承受”之重的讨论。

事件核心：发生了什么

据 Axios 于 5 月 28 日援引一位 AI 顾问的说法，其所属企业客户在单月内因使用 Anthropic 旗下大模型 Claude 而产生了 5 亿美元的费用。直接原因并非模型单价上涨，而是企业未对员工使用量设置任何上限，导致大规模、无节制地调用 API 进行推理。目前公开信息显示，这笔巨额账单仅涉及推理成本，不包含模型训练或定制费用。该案例迅速在 AI 行业和企业采购圈内传播，成为“AI 成本失控”的标志性事件。

为什么重要

这起事件至少从三个层面冲击了当前的 AI 商业化叙事。第一，它打破了“大模型 API 按量计费天然可控”的幻觉。对于企业而言，大型语言模型的推理成本仍处于高位，尤其是在高并发、长文本或频繁调用场景下，放任式使用可以瞬间耗尽预算。第二，它向所有大模型供应商（包括 OpenAI、Google、Meta 等）发出信号：若不能提供更精细的用量管理和成本控制工具，企业级客户可能被迫转向更便宜的开源模型或本地部署方案。第三，该案例发生在 2026 年 5 月底，正值全球企业加速引入生成式 AI 的窗口期，它可能成为许多 CIO 暂停或收缩大规模 AI 部署的依据。

对用户/开发者/创作者的影响

对于普通用户和开发者而言，该新闻的最大启示是：不要假设 AI 服务“便宜到可以随便用”。对于调用 Claude、GPT-4o 等顶尖闭源模型的 API 开发者，需要主动在代码层面添加配额、限流和预算告警，否则一次未加防护的生产环境调用就可能产生天价账单。对于企业采购者，这次事件强烈建议在服务合同中明确设置“支出上限”和“异常消耗告警机制”，并评估引入混合推理策略——将高频、低敏感度的任务迁移至成本更低的模型或本地推理。对于以 AI 为卖点的 SaaS 公司和创作者工具，这次事件可能引发用户对“按用量付费”模式的反感，倒逼更多平台采用订阅制或 token 打包制来对冲成本波动。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，Anthropic 是否会因此事件调整 Claude API 的定价结构或推出“企业预算保护”功能？目前公开信息显示，该公司尚未宣布具体政策变动。第二，其他大模型厂商如 OpenAI 的 GPT-4o 和 Google 的 Gemini 是否也会出现类似超支案例，并促使行业统一推出“用量硬上限”标准功能。第三，开源社区和推理优化方案（如 vLLM、TensorRT-LLM 等）是否会在企业部署中加速取代闭源 API，以避免此类账单风险。若此类失控案例持续出现，可能直接改变未来两年企业 AI 基础设施的采购格局。

来源：Readhub · AI

忘了设限，1 家公司 1 个月在 Claude 烧掉 5 亿美元！—— 当 AI 已经贵到「用不起」