机构:北美 CSP 大举购置 NVIDIA GB/Rubin 整柜式方案 2026 年 AI 推理算力将跃升 1.2 倍

机构:北美 CSP 大举购置 NVIDIA GB/Rubin 整柜式方案 2026 年 AI 推理算力将跃升 1.2 倍

机构:北美 CSP 大举购置 NVIDIA GB/Rubin 整柜式方案 2026 年 AI 推理算力将跃升 1.2 倍

一句话看懂:TrendForce 最新报告指出,北美五大云服务商(CSP)正大规模采购英伟达 GB 及 Rubin 架构的整柜式 AI 服务器方案,预计到 2026 年,这些厂商的总 AI 推理算力将年增约 122%,训练算力年增超 56%。这意味着 AI 算力部署正在从训练重心向推理应用加速转移,对开发者调用 API、企业部署模型及算力成本都将产生直接影响。

事件核心:发生了什么

根据 TrendForce 集邦咨询 5 月 20 日发布的 AI 产业研究,2026 年 AI 训练机种将占所有 AI 服务器出货量的约 55%,但中长期看,推理机种将逐步成为市场主力。具体到北美五大 CSP(谷歌、微软、亚马逊、Meta、苹果/甲骨文等),由于大规模采购英伟达 GB 系列以及下一代 Rubin 整柜式方案,预计 2026 年其总 AI 训练算力同比增长 56% 以上,总 AI 推理算力同比增长约 122%。与此同时,英伟达、AMD 以及 CSP 自研的 ASIC 芯片平台也将同步放量,推动五大 CSP 的服务器功耗年增约 116%。

为什么重要

这一趋势清晰表明,AI 产业的算力需求正在从“训练模型”向“运行模型”(推理)大规模转移。推理算力增速(122%)远超训练算力增速(56%),意味着越来越多的 AI 应用已经进入生产环境,例如大模型的在线问答、图像生成、代码补全等场景正在消耗更多实时计算资源。对于英伟达而言,GB 与 Rubin 整柜式方案的采购放量,说明其高端 GPU 及配套网络/散热方案正在从实验室走向规模化数据中心。对于 AMD 和自研 ASIC 的 CSP 来说,这是一个加速追赶的窗口:推理场景对低延迟、高能效的芯片需求更敏感,而不仅仅是峰值算力。

对用户/开发者/创作者的影响

对于依赖云 API 调用大模型的开发者和创作者来说,推理算力供给的大幅提升可能带来两方面的变化:一是推理成本(每 token 价格)有望进一步下降,因为云厂商有了更多算力来分摊固定成本;二是模态和响应速度会继续改善,例如更长的上下文、更快的图像生成。对于企业采购者,2026 年机柜级方案的普及意味着部署门槛降低:整柜式方案(GB/VR)可大幅缩短从采购到上线的时间,并简化运维。对于关注硬件投资的人,服务器功耗翻倍带来的散热和电力需求,将促使更多数据中心升级液冷等基础设施,相关产业链存在持续机会。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,英伟达 Rubin 架构是否如期在 2026 年量产供货,以及其对比 Hopper 和 Blackwell 的能效比提升幅度,将直接影响五大 CSP 的实际部署进度。第二,CSP 自研 ASIC(如谷歌 TPU、亚马逊 Trainium/Inferentia)在推理场景下的表现,是否会在价格和生态上形成差异化竞争,从而削弱英伟达的垄断地位。第三,服务器功耗年增 116% 的数据是否会触发部分地区的电力配额限制或碳排新规,进而影响算力资源的地理分布和用户使用成本。

来源:Readhub · AI

celebrityanime
celebrityanime
文章: 3041

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注