
一句话看懂:随着大模型训练与推理成本持续暴涨,从科技巨头到初创公司都在采取行动削减 AI 基础设施开支。这并非需求减弱,而是行业正在从“先跑通模型”转向“算力精细化运营”。
事件核心:发生了什么
据《经济学人》近期报道,多家公司正面临人工智能成本快速增长的压力。训练一次前沿大模型的电费与算力租金已动辄数千万美元,而推理(即模型上线后被用户调用的计算成本)更成为长期支出大头。微软、谷歌、亚马逊等云服务商已开始重新评估数据中心扩张计划,部分企业则转向更高效的模型架构,或者直接选择开源小模型来替代一味堆参数的大模型。与此同时,英伟达的高端 GPU 依然供不应求,但部分客户已开始探索自研芯片或采用 AMD 替代方案以寻求定价话语权。
为什么重要
成本飙升意味着早期“烧钱换用户”的商业模式难以为继。如果推理价格无法降到足够低,很多依赖 API 的 AI 应用(如客服、编程助手、图像生成工具)将无法实现正向盈利。这场成本竞赛正在分化行业格局:拥有自有芯片和自研模型的大厂可以把单位成本压更低,而依赖第三方 API 的创业公司利润空间被严重挤压。同时,开源社区的低成本小型模型正在赢得更多部署场景,迫使闭源厂商通过降价(如 OpenAI 多次降低 GPT-4o 的 API 价格)来维持份额。
对用户/开发者/创作者的影响
对于使用 API 的开发者,好消息是短期内主流模型价格可能继续下降——厂商为了留住客户会不断压缩利润。坏消息是长期看,“优质模型”和“开源廉价模型”之间的能力差距可能重新拉大。创作者使用 AI 生成图像或视频时,单次生成成本依然不低,未来平台可能更严格限制免费额度。企业采购 AI 服务时,建议不仅比较模型能力,还要详细测算在预期调用量下的总拥有成本,特别是推理耗电量与 GPU 租赁费用。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,三季度财报季将是关键观察窗口——如果头部云厂商的 AI 收入增长仍快于资本开支增长,说明高成本还在可接受范围;反之可能触发更激进的芯片自研。第二,开源社区中基于“混合专家模型”(MoE)和小参数模型的推理效率突破是否能在实际部署中落地。第三,英伟达 B200(Blackwell)架构的量产进度与定价,将直接影响 2025 年企业算力采购决策。
来源:econ.st

![[Question]: Cann't start ragflow-es-01](https://www.chat-gpts.plus/wp-content/uploads/2026/06/2884-5451f7ce-768x403.jpg)
