
一句话看懂:Bloomberg 在 2026 年的分析中指出,AI 大模型训练与推理对 HBM(高带宽内存)和 DDR5(第五代双倍数据率内存)的疯狂需求,已挤压消费电子、服务器等行业的 DRAM 供给,推高了手机、PC、汽车乃至云服务的整体价格。
事件核心:发生了什么
根据 Bloomberg 的报道,AI 热潮正在引发一场全球性的存储芯片短缺。训练 GPT-4 级别的大模型需要海量 HBM 内存,而每一次用户使用 AI 聊天、图像生成或代码补全(推理阶段),同样消耗大量高带宽内存。这导致三星、SK 海力士、美光等存储巨头将产能优先分配给 AI 芯片配套的 HBM3 和 HBM4 产品,传统 DRAM 产能被大幅挤占。2026 年的数据显示,服务器 DDR5 内存价格同比上涨超过 30%,消费级 DDR5 内存条价格也出现了罕见的上扬。苹果、戴尔、特斯拉等公司均表示,内存采购成本压力正在传导至终端产品的定价中。
为什么重要
这一现象的意义超越了单纯的硬件涨价。它揭示了 AI 基础设施从“训练驱动”向“训练+推理双轮驱动”的转变带来的真实成本。过去市场担忧算力(GPU)供应不足,现在内存芯片成了新的瓶颈。对于云厂商(AWS、Azure、Google Cloud)而言,服务器采购成本上升将直接传导到 GPU 云实例和 API 调用价格。更深层的影响是,它可能重塑 AI 模型架构的路线——开发者将更倾向于使用低精度量化、稀疏化、MoE(混合专家)等能降低内存占用的技术,闭源模型厂商或许会依靠定制化硬件(如自研内存方案)构建竞争优势,而开源社区可以依赖更灵活的内存分配策略来优化部署成本。
对用户/开发者/创作者的影响
- 普通用户:购买新一代 PC、手机或游戏主机时,将面临更高的起步价;使用 ChatGPT、Midjourney 等 AI 服务可能会看到订阅费或按次计费价格的隐性上涨,因为云厂商正在分摊硬件成本。
- AI 开发者与工程师:部署开源大模型(如 Llama、Mistral、Qwen)到云端或本地时,内存租用成本会显著增加,这迫使开发者更精细地优化模型大小和推理吞吐量,或者转向更便宜的专用推理芯片方案。
- 内容创作者:AI 视频生成、高分辨率图像制作等重度推理任务变得昂贵,创作工具(如 Adobe、Canva、Runway)可能提高高级功能订阅价格或限制免费套餐的生成次数。
值得关注的后续
第一,内存厂商是否会加速扩建 HBM 产线,并承诺提高传统 DRAM 的产能,以缓解当前供需缺口。第二,Meta、Google 等大型玩家是否会加码自研芯片(ASIC/TPU),通过捆绑自家内存方案来绕开现货市场的涨价。第三,监管机构是否会对存储芯片市场的集中度及其对 AI 行业价格的影响展开调查,考虑到三星、SK 海力士、美光三家占据了超过 90% 的 HBM 份额。



