一文看懂”算力通胀”：为什么你用AI越来越便宜，算力公司却越来越赚钱？

一文看懂”算力通胀”：为什么你用AI越来越便宜，算力公司却越来越赚钱？

一句话看懂：2026年，中国日均Token调用量突破140万亿次，主流AI模型API价格暴跌80%-99%，但算力租赁总收入和单价反而上涨——GPU时租从1.70美元涨至2.35美元，东阳光云智算签下超160亿元大单。核心原因不是简单的规模效应，而是“算力通胀悖论”：降价刺激用量爆炸式增长，总需求远超供给，同时定价模式从固定租赁转向按Token分成，让算力公司直接分享AI应用的商业增长。

事件核心：发生了什么

据东方财富2026年5月数据，从2024年初到2026年3月，中国日均Token调用量增长了上千倍，达到140万亿次。同期，DeepSeek、Kimi、通义千问等大模型的API百万token调用成本，从几十元降至几分钱，降幅达80%-99%。然而，算力租赁价格并未同步下降：利通电子2026年5月年报显示，GPU租赁价格从2025年10月的1.70美元/小时升至2026年3月的2.35美元/小时，涨幅近40%。东阳光也在2026年5月公告称，旗下云智算子公司签下160亿至190亿元的算力服务大单。这组矛盾数据背后，是算力定价模式从“停车位式”（固定时长租赁）向“加油站式”（按Token调用量分成）的转移。

为什么重要

“算力通胀悖论”正在重塑AI产业链利润分配。直觉上，模型降价应意味着算力过剩、价格走低；但实际需求增速（千倍级）远超供给扩张速度——谷歌、亚马逊、微软2026年合计4500亿美元资本支出，最快也要2028年才能交付数据中心，而AI应用需求已在2026年集中爆发。“按Token分成”新模式让算力公司从卖租约变为参与应用层变现：用量指数增长时，算力收入随之线性攀升，议价能力系统性提升。这类似1990年代互联网泡沫中，最终赚钱的并非网页内容公司，而是卖“镐头铲子”的服务器和网线厂商——在AI时代，算力就是这个“镐头铲子”。

对用户/开发者/创作者的影响

普通用户：基础AI功能会持续低价甚至免费，但高端任务（如长篇小说生成、专业图像渲染）将出现分级付费。豆包推出付费版已是信号，免费部分的作用范围可能收窄。开发者/创作者：若在API基础上构建AI应用，算力成本将成为核心变量——Token分成模式下，成本随用户用量线性增长。做财务预算时需预留算力波动空间，而非仅按当前API价格估算。对于图像生成等算力密集型工具，选择自建推理集群还是按量租赁，需要更精细的TCO计算。

值得关注的后续

1. 定价模式扩散速度：目前“按Token分成”仍在早期，是否会被更多算力平台采用，以及分佣比例如何设定，将直接影响应用层利润率。2. 供需缺口何时缓解：若2028年数据中心集中交付，算力供给大增可能逆转当前稀缺格局，但前提是AI应用需求增速不降级。3. 算力资本开支对应用生态的影响：当头部云厂商将资金砸向算力基建，其对AI应用创投的投入是否会被挤占，可能影响下一波创新公司的融资环境。

来源：36氪 · 24小时热榜

一文看懂”算力通胀”：为什么你用AI越来越便宜，算力公司却越来越赚钱？