一文看懂”算力通胀”:为什么你用AI越来越便宜,算力公司却越来越赚钱?

一文看懂”算力通胀”:为什么你用AI越来越便宜,算力公司却越来越赚钱?

一句话看懂:2026年,中国日均Token调用量突破140万亿次,主流AI模型API价格暴跌80%-99%,但算力租赁总收入和单价反而上涨——GPU时租从1.70美元涨至2.35美元,东阳光云智算签下超160亿元大单。核心原因不是简单的规模效应,而是“算力通胀悖论”:降价刺激用量爆炸式增长,总需求远超供给,同时定价模式从固定租赁转向按Token分成,让算力公司直接分享AI应用的商业增长。

事件核心:发生了什么

据东方财富2026年5月数据,从2024年初到2026年3月,中国日均Token调用量增长了上千倍,达到140万亿次。同期,DeepSeek、Kimi、通义千问等大模型的API百万token调用成本,从几十元降至几分钱,降幅达80%-99%。然而,算力租赁价格并未同步下降:利通电子2026年5月年报显示,GPU租赁价格从2025年10月的1.70美元/小时升至2026年3月的2.35美元/小时,涨幅近40%。东阳光也在2026年5月公告称,旗下云智算子公司签下160亿至190亿元的算力服务大单。这组矛盾数据背后,是算力定价模式从“停车位式”(固定时长租赁)向“加油站式”(按Token调用量分成)的转移。

为什么重要

“算力通胀悖论”正在重塑AI产业链利润分配。直觉上,模型降价应意味着算力过剩、价格走低;但实际需求增速(千倍级)远超供给扩张速度——谷歌、亚马逊、微软2026年合计4500亿美元资本支出,最快也要2028年才能交付数据中心,而AI应用需求已在2026年集中爆发。“按Token分成”新模式让算力公司从卖租约变为参与应用层变现:用量指数增长时,算力收入随之线性攀升,议价能力系统性提升。这类似1990年代互联网泡沫中,最终赚钱的并非网页内容公司,而是卖“镐头铲子”的服务器和网线厂商——在AI时代,算力就是这个“镐头铲子”。

对用户/开发者/创作者的影响

普通用户:基础AI功能会持续低价甚至免费,但高端任务(如长篇小说生成、专业图像渲染)将出现分级付费。豆包推出付费版已是信号,免费部分的作用范围可能收窄。开发者/创作者:若在API基础上构建AI应用,算力成本将成为核心变量——Token分成模式下,成本随用户用量线性增长。做财务预算时需预留算力波动空间,而非仅按当前API价格估算。对于图像生成等算力密集型工具,选择自建推理集群还是按量租赁,需要更精细的TCO计算。

值得关注的后续

1. 定价模式扩散速度:目前“按Token分成”仍在早期,是否会被更多算力平台采用,以及分佣比例如何设定,将直接影响应用层利润率。2. 供需缺口何时缓解:若2028年数据中心集中交付,算力供给大增可能逆转当前稀缺格局,但前提是AI应用需求增速不降级。3. 算力资本开支对应用生态的影响:当头部云厂商将资金砸向算力基建,其对AI应用创投的投入是否会被挤占,可能影响下一波创新公司的融资环境。

来源:36氪 · 24小时热榜

celebrityanime
celebrityanime
文章: 3398

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注