当 Token 越来越便宜,账单为什么越来越贵

大模型 token 价格六年内下降了约 600 倍,但企业级用户和重度开发者的 AI 账单却在飙升。原因是 AI 从聊天写作等轻任务转向复杂的 Agent 开发与推理任务,实际 token 消耗量级暴涨;同时,最顶尖的旗舰模型并未跟随降价趋势,反而因稀缺性和不可替代性出现明涨或暗涨。

当 Token 越来越便宜,账单为什么越来越贵

一句话看懂:大模型 token 价格六年内下降了约 600 倍,但企业级用户和重度开发者的 AI 账单却在飙升。原因是 AI 从聊天写作等轻任务转向复杂的 Agent 开发与推理任务,实际 token 消耗量级暴涨;同时,最顶尖的旗舰模型并未跟随降价趋势,反而因稀缺性和不可替代性出现明涨或暗涨。

事件核心:发生了什么

武汉大学团队统计显示,过去六年 token 价格整体下降约 600 倍,经济档模型半衰期仅 1.10 年。但 Django 联合创始人 Simon Willison 透露,他过去 30 天消耗了价值 2180.16 美元的 token,实际支付仅 200 美元,这种补贴正在消失。OpenAI 将 GPT-5.5 输入输出价格从 2.5/10 美元提至 5/30 美元;Anthropic 未提高 Opus 4.7 挂牌价,但通过新 tokenizer 使相同文本 token 量最多增加 35%,有效成本达上代的 1.4 倍。Uber 在 2026 年初因使用 Claude Code 烧穿了全年 AI 预算。同一时期,DeepSeek 将 V4-Pro 价格降至 GPT-5.5 的七分之一,智谱开源 GLM-5.1 编程能力达 Claude Opus 4.6 的 94.6%。

为什么重要

这表明大模型定价正出现明显的分层和分化。经济档与中档模型遵循降价规律,正在快速商品化;而旗舰顶级模型的降价规律几乎失效(指数拟合 R² 仅 0.031),推理模型相对普通模型存在平均 31.5 倍溢价。顶级 token 的定价逻辑从成本驱动转向稀缺性与不可替代性驱动。这背后是两种产业路线的对赌:美国闭源玩家赌“最先进能力”的城墙足够厚,靠溢价持续投入下一代算力;中国玩家赌技术扩散速度快于收租速度,通过工程化和规模化把顶级能力变为大众可及的商品。

对用户/开发者/创作者的影响

对于重度使用者和企业开发者:账单上涨是真实的,且可能持续。顶级模型提供的稀缺能力(如复杂代码审查、金融分析)有明确价值,但价格不再补贴。需要更精细化地评估任务价值,在旗舰模型和降级模型之间灵活切换。对于轻量用户和创作者:底层能力继续普及,经济档模型成本不断下降,日常的文本生成、图像生成等任务费用会更低。企业采购方需要关注的是:预算规划中要区分“能力导向”的旗舰支出和“成本导向”的规模化部署支出,前者将更接近硬通货定价,后者则持续受益于通缩。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

1. 旗舰模型提价能否持续:用户是否愿意为 31.5 倍的推理溢价买单,还是加速转向蒸馏或开源替代方案。2. 开源追赶速度:GLM-5.1 已证明编程能力接近顶尖闭源,后续其他能力的追赶节奏将决定技术扩散的成色。3. 企业预算调整:如果类似 Uber 烧穿预算的案例增多,可能会倒逼企业自建模型或采用更多本地化推理方案,进而影响整个 API 调用市场的结构。

来源:Readhub · AI

celebrityanime
celebrityanime
文章: 7797

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注