
token 经济学的工业化竞争
一句话看懂:2026年5月,微软因成本压力内部限制Claude Code使用、DeepSeek宣布V4-Pro永久降价75%、华为提出“韬定律”重构芯片效率,三个信号表明token正从技术单元转变为生产要素,全球AI进入以效率为中心的工业化竞赛。
事件核心:发生了什么
三条线索几乎同时出现。第一,微软要求Windows、Office等部门在6月底前停用Anthropic的Claude Code,迁移至自家GitHub Copilot CLI,原因是“太贵”,财务部门未见代码规模增长转化为软件收入;同时对外GitHub Copilot转向按量计费。第二,DeepSeek宣布V4-Pro永久降价75%,其指定测评任务运行成本仅为Gemini-3.1-Pro-Preview的1/3、GPT-5.5的约1/12、Claude-Opus-4.7的约1/19,降价的底气来自DualPath架构将KV缓存命中率提升至95%,重构了AI成本函数。第三,华为发布“韬定律”框架,首款折叠超级CPU鲲鹏950通过逻辑折叠减少投影面积约40%、提升频率至3.2GHz、能效提高超10%,同时已量产61.44TB和122.88TB自研SSD,并推出高带宽内存HiBL 1.0。
为什么重要
这三个信号揭示token经济学正在发生结构性转变。一方面,智能体的普及使单次任务中位token消耗达到10万级别,前沿模型的单位token价格却在上涨——Gemini-3.5-Flash是前代的6倍,GPT-5.5是前代的2倍,行业普遍面临“成本与价值不对等”的预算约束。另一方面,DeepSeek和华为分别从算法创新和底层硬件重构效率边界,使廉价token具备覆盖更广阔实体市场的潜力。两条效率边界正在博弈:AI工厂内部需在吞吐量、延迟和成本之间寻找帕累托最优;市场端则在“高成本高性能”与“廉价够用”模型之间持续移动最优点。目前昂贵token尚未在营收报表上证明自身价值,而DeepSeek等低价玩家已开始抢占市场。
对用户/开发者/创作者的影响
对开发者:调用API的成本差异急剧扩大。若使用DeepSeek V4-Pro进行推理,成本可降至硅谷模型的1/12到1/19,开发者应重新评估模型选择,特别是涉及多轮交互或大规模智能体的应用,可利用DeepSeek的缓存机制设计更省钱的框架。同时注意微软等平台正将外部API转向按量计费,使用前需仔细计算token消耗预算。
对企业采购者:微软内部限制Claude Code的案例表明,AI工具的成本必须与营收增长挂钩,企业应建立token使用的成本核算机制,避免“用得很爽但财务不买单”的困境。
对最终用户:低价token可能催生更多免费或低价的AI应用,但高智能场景仍可能面临涨价,未来AI产品的定价模式将更加分化。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,DeepSeek V4.1版本是否如期发布,以及其“Engram”记忆架构能否进一步降低token成本。第二,华为鲲鹏960是否延续折叠架构并应用于更多AI推理场景,其全栈存储算力生态能否适配DeepSeek等模型实现端到端降本。第三,硅谷前沿模型在涨价压力下,是否会以绩效模型或分层价格策略回应DeepSeek的价格冲击,以及微软对内部和外部API的策略调整是否会引发其他科技巨头跟进。
来源:Readhub · AI


