
忘了设限,1 家公司 1 个月在 Claude 烧掉 5 亿美元!—— 当 AI 已经贵到「用不起」
一句话看懂:一家企业客户因未设置员工使用上限,在单月内向 Anthropic 的 Claude 支付了 5 亿美元账单。这一事件暴露了企业 AI 采购中缺乏成本管控的普遍风险,也引发了对大模型推理成本是否已达“不可承受”之重的讨论。
事件核心:发生了什么
据 Axios 于 5 月 28 日援引一位 AI 顾问的说法,其所属企业客户在单月内因使用 Anthropic 旗下大模型 Claude 而产生了 5 亿美元的费用。直接原因并非模型单价上涨,而是企业未对员工使用量设置任何上限,导致大规模、无节制地调用 API 进行推理。目前公开信息显示,这笔巨额账单仅涉及推理成本,不包含模型训练或定制费用。该案例迅速在 AI 行业和企业采购圈内传播,成为“AI 成本失控”的标志性事件。
为什么重要
这起事件至少从三个层面冲击了当前的 AI 商业化叙事。第一,它打破了“大模型 API 按量计费天然可控”的幻觉。对于企业而言,大型语言模型的推理成本仍处于高位,尤其是在高并发、长文本或频繁调用场景下,放任式使用可以瞬间耗尽预算。第二,它向所有大模型供应商(包括 OpenAI、Google、Meta 等)发出信号:若不能提供更精细的用量管理和成本控制工具,企业级客户可能被迫转向更便宜的开源模型或本地部署方案。第三,该案例发生在 2026 年 5 月底,正值全球企业加速引入生成式 AI 的窗口期,它可能成为许多 CIO 暂停或收缩大规模 AI 部署的依据。
对用户/开发者/创作者的影响
对于普通用户和开发者而言,该新闻的最大启示是:不要假设 AI 服务“便宜到可以随便用”。对于调用 Claude、GPT-4o 等顶尖闭源模型的 API 开发者,需要主动在代码层面添加配额、限流和预算告警,否则一次未加防护的生产环境调用就可能产生天价账单。对于企业采购者,这次事件强烈建议在服务合同中明确设置“支出上限”和“异常消耗告警机制”,并评估引入混合推理策略——将高频、低敏感度的任务迁移至成本更低的模型或本地推理。对于以 AI 为卖点的 SaaS 公司和创作者工具,这次事件可能引发用户对“按用量付费”模式的反感,倒逼更多平台采用订阅制或 token 打包制来对冲成本波动。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,Anthropic 是否会因此事件调整 Claude API 的定价结构或推出“企业预算保护”功能?目前公开信息显示,该公司尚未宣布具体政策变动。第二,其他大模型厂商如 OpenAI 的 GPT-4o 和 Google 的 Gemini 是否也会出现类似超支案例,并促使行业统一推出“用量硬上限”标准功能。第三,开源社区和推理优化方案(如 vLLM、TensorRT-LLM 等)是否会在企业部署中加速取代闭源 API,以避免此类账单风险。若此类失控案例持续出现,可能直接改变未来两年企业 AI 基础设施的采购格局。
来源:Readhub · AI


