机构：北美 CSP 大举购置 NVIDIA GB/Rubin 整柜式方案 2026 年 AI 推理算力将跃升 1.2 倍

一句话看懂：TrendForce 最新报告指出，北美五大云服务商（CSP）正大规模采购英伟达 GB 及 Rubin 架构的整柜式 AI 服务器方案，预计到 2026 年，这些厂商的总 AI 推理算力将年增约 122%，训练算力年增超 56%。这意味着 AI 算力部署正在从训练重心向推理应用加速转移，对开发者调用 API、企业部署模型及算力成本都将产生直接影响。

事件核心：发生了什么

根据 TrendForce 集邦咨询 5 月 20 日发布的 AI 产业研究，2026 年 AI 训练机种将占所有 AI 服务器出货量的约 55%，但中长期看，推理机种将逐步成为市场主力。具体到北美五大 CSP（谷歌、微软、亚马逊、Meta、苹果/甲骨文等），由于大规模采购英伟达 GB 系列以及下一代 Rubin 整柜式方案，预计 2026 年其总 AI 训练算力同比增长 56% 以上，总 AI 推理算力同比增长约 122%。与此同时，英伟达、AMD 以及 CSP 自研的 ASIC 芯片平台也将同步放量，推动五大 CSP 的服务器功耗年增约 116%。

为什么重要

这一趋势清晰表明，AI 产业的算力需求正在从“训练模型”向“运行模型”（推理）大规模转移。推理算力增速（122%）远超训练算力增速（56%），意味着越来越多的 AI 应用已经进入生产环境，例如大模型的在线问答、图像生成、代码补全等场景正在消耗更多实时计算资源。对于英伟达而言，GB 与 Rubin 整柜式方案的采购放量，说明其高端 GPU 及配套网络/散热方案正在从实验室走向规模化数据中心。对于 AMD 和自研 ASIC 的 CSP 来说，这是一个加速追赶的窗口：推理场景对低延迟、高能效的芯片需求更敏感，而不仅仅是峰值算力。

对用户/开发者/创作者的影响

对于依赖云 API 调用大模型的开发者和创作者来说，推理算力供给的大幅提升可能带来两方面的变化：一是推理成本（每 token 价格）有望进一步下降，因为云厂商有了更多算力来分摊固定成本；二是模态和响应速度会继续改善，例如更长的上下文、更快的图像生成。对于企业采购者，2026 年机柜级方案的普及意味着部署门槛降低：整柜式方案（GB/VR）可大幅缩短从采购到上线的时间，并简化运维。对于关注硬件投资的人，服务器功耗翻倍带来的散热和电力需求，将促使更多数据中心升级液冷等基础设施，相关产业链存在持续机会。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，英伟达 Rubin 架构是否如期在 2026 年量产供货，以及其对比 Hopper 和 Blackwell 的能效比提升幅度，将直接影响五大 CSP 的实际部署进度。第二，CSP 自研 ASIC（如谷歌 TPU、亚马逊 Trainium/Inferentia）在推理场景下的表现，是否会在价格和生态上形成差异化竞争，从而削弱英伟达的垄断地位。第三，服务器功耗年增 116% 的数据是否会触发部分地区的电力配额限制或碳排新规，进而影响算力资源的地理分布和用户使用成本。

来源：Readhub · AI

机构：北美 CSP 大举购置 NVIDIA GB/Rubin 整柜式方案 2026 年 AI 推理算力将跃升 1.2 倍