token 经济学的工业化竞争

一句话看懂：2026年5月，微软因成本压力内部限制Claude Code使用、DeepSeek宣布V4-Pro永久降价75%、华为提出“韬定律”重构芯片效率，三个信号表明token正从技术单元转变为生产要素，全球AI进入以效率为中心的工业化竞赛。

事件核心：发生了什么

三条线索几乎同时出现。第一，微软要求Windows、Office等部门在6月底前停用Anthropic的Claude Code，迁移至自家GitHub Copilot CLI，原因是“太贵”，财务部门未见代码规模增长转化为软件收入；同时对外GitHub Copilot转向按量计费。第二，DeepSeek宣布V4-Pro永久降价75%，其指定测评任务运行成本仅为Gemini-3.1-Pro-Preview的1/3、GPT-5.5的约1/12、Claude-Opus-4.7的约1/19，降价的底气来自DualPath架构将KV缓存命中率提升至95%，重构了AI成本函数。第三，华为发布“韬定律”框架，首款折叠超级CPU鲲鹏950通过逻辑折叠减少投影面积约40%、提升频率至3.2GHz、能效提高超10%，同时已量产61.44TB和122.88TB自研SSD，并推出高带宽内存HiBL 1.0。

为什么重要

这三个信号揭示token经济学正在发生结构性转变。一方面，智能体的普及使单次任务中位token消耗达到10万级别，前沿模型的单位token价格却在上涨——Gemini-3.5-Flash是前代的6倍，GPT-5.5是前代的2倍，行业普遍面临“成本与价值不对等”的预算约束。另一方面，DeepSeek和华为分别从算法创新和底层硬件重构效率边界，使廉价token具备覆盖更广阔实体市场的潜力。两条效率边界正在博弈：AI工厂内部需在吞吐量、延迟和成本之间寻找帕累托最优；市场端则在“高成本高性能”与“廉价够用”模型之间持续移动最优点。目前昂贵token尚未在营收报表上证明自身价值，而DeepSeek等低价玩家已开始抢占市场。

对用户/开发者/创作者的影响

对开发者：调用API的成本差异急剧扩大。若使用DeepSeek V4-Pro进行推理，成本可降至硅谷模型的1/12到1/19，开发者应重新评估模型选择，特别是涉及多轮交互或大规模智能体的应用，可利用DeepSeek的缓存机制设计更省钱的框架。同时注意微软等平台正将外部API转向按量计费，使用前需仔细计算token消耗预算。
对企业采购者：微软内部限制Claude Code的案例表明，AI工具的成本必须与营收增长挂钩，企业应建立token使用的成本核算机制，避免“用得很爽但财务不买单”的困境。
对最终用户：低价token可能催生更多免费或低价的AI应用，但高智能场景仍可能面临涨价，未来AI产品的定价模式将更加分化。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，DeepSeek V4.1版本是否如期发布，以及其“Engram”记忆架构能否进一步降低token成本。第二，华为鲲鹏960是否延续折叠架构并应用于更多AI推理场景，其全栈存储算力生态能否适配DeepSeek等模型实现端到端降本。第三，硅谷前沿模型在涨价压力下，是否会以绩效模型或分层价格策略回应DeepSeek的价格冲击，以及微软对内部和外部API的策略调整是否会引发其他科技巨头跟进。

来源：Readhub · AI

token 经济学的工业化竞争