
英伟达与 SK 海力士宣布多年期技术合作,共同开发下一代 AI 内存
一句话看懂:英伟达与 SK 海力士签署多年期合作协议,联合研发专为 AI 训练和推理优化的下一代高带宽内存(HBM)。这直接关系到未来大模型训练成本、推理速度以及 AI 芯片的整体算力上限。
事件核心:发生了什么
据 Readhub 报道,英伟达与 SK 海力士于近日宣布建立一项多年期技术合作关系,双方将共同开发面向 AI 工作负载的下一代内存解决方案。SK 海力士是目前全球领先的高带宽内存(HBM)供应商,其 HBM3E 产品已广泛应用于英伟达的 H100、H200 及 Blackwell 系列 AI 加速卡。此次合作将专注于 HBM4 及后续代际的联合设计,确保英伟达未来的 GPU 架构能够在内存带宽和功耗效率上实现突破。
为什么重要
在 AI 大模型时代,显存带宽已经成为制约训练吞吐量和推理延迟的核心瓶颈。英伟达与 SK 海力士的深度绑定意味着:一是从芯片架构层面进行“交钥匙式”定制,减少传统内存与 GPU 之间的适配损耗;二是可以提前锁定下一代 HBM 产能,避免因供应链短缺导致产品延期。对行业而言,这种“算力+内存”的联合技术路线将进一步提升 AI 基础设施的性能天花板,同时也增加了其他内存供应商(如三星、美光)的追赶压力。
对用户/开发者/创作者的影响
目前公开信息显示,HBM4 预计将在 2026 年实现量产。对于开发者而言,更快的显存带宽意味着在本地或云端运行大模型推理时,响应延迟会进一步降低;对于 AI 应用企业和创作者,若 HBM 产能充足,英伟达 GPU 的价格可能不会因供需失衡而剧烈波动。此外,如果 HBM4 能实现单位能耗下的更高算力,云端 API 的费用有望随之下降,这是利好转账式 AI 应用的长期信号。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,HBM4 的具体规格(如容量、带宽、功耗)是否会在合作中对外公布,以及它与英伟达下一代 GPU 架构(如 Rubin 平台)的兼容性关系。第二,三星和美光是否会推出类似的联合开发计划,或通过技术突破重新切入英伟达旗舰显卡的供应链。第三,这一合作对云服务厂商(如微软、亚马逊)选择自研 AI 芯片的内存策略是否会构成压力,进而影响整个 AI 算力市场的竞争格局。
来源:Readhub · AI


