
财联社 5 月 21 日电,英伟达 CEO 黄仁勋称,包括自身产品在内的基于 SRAM 的 AI 芯片,在一段时间内将是一个小众产品。
一句话看懂:英伟达 CEO 黄仁勋公开判断,基于 SRAM(静态随机存取存储器)架构的 AI 芯片短期内不会成为主流,这类方案在更广泛的市场中只能扮演小众角色。这番表态直接回应了市场对新型 AI 芯片技术路线的关注,也侧面确认了英伟达当前主推的 HBM(高带宽存储器)方案的延续性。
事件核心:发生了什么
财联社 5 月 21 日报道,英伟达 CEO 黄仁勋在公开场合表示,基于 SRAM 的 AI 芯片——包括英伟达自身相关产品——在未来一段时间内都将是一个小众产品。SRAM 是一种传统的片上存储器技术,速度极快但密度低、成本高,近年来被一些 AI 芯片初创公司(如 Cerebras、Groq 等)用来替代 HBM 以追求极致推理延迟。黄仁勋的发言相当于明确表态,英伟达不会将 SRAM 路线作为主流策略,其数据中心 GPU 将继续依赖 HBM 以及下一代内存方案(如 GDDR7 或 CXL 互连)。
为什么重要
过去几年,多个 AI 芯片创业公司以“更快推理性能”为卖点,尝试用 SRAM 替代 HBM 来获得稀疏模型下的延迟优势。黄仁勋的言论相当于从英伟达的视角给这条路线“降温”:SRAM 方案在成本、容量可扩展性上存在根本瓶颈,很难支撑大模型训练和大规模推理集群的经济性。这一判断也暗示,英伟达将继续在 HBM 和先进封装上押注,而非分心研发 SRAM 为主的专用 AI 芯片。对 AI 算力市场而言,这意味着主流基础设施将继续以 HBM 为第一选择,SRAM 芯片只会在极少数对延迟极其敏感但模型规模可控的场景中出现。
对用户/开发者/创作者的影响
对于正在采购算力的企业用户而言,黄仁勋的表态意味着短期内不要指望出现一款“SRAM 万能加速卡”来降低大模型推理成本。对于开发者而言,基于 CUDA 及英伟达生态的工具链与推理优化策略仍将以 HBM 为主要匹配对象,SRAM 类芯片所需的算子库和支持方案极有可能长期处于生态边缘。企业用户在评估 AI 基础设施时,应将“HBM 为主、SRAM 为辅”作为技术选型的前提,不必为 SRAM 芯片创业公司的宣传投入过高的预期。
值得关注的后续
第一,英伟达是否会在下一代的 Grace Blackwell 或 Rubin 架构中,通过引入更快的 SRAM 缓存(而非完全替代 HBM)来优化局部推理性能;第二,以 Groq 为代表的 SRAM 芯片厂商是否会调整产品定位,或在非大模型场景(如边缘推理、超低延迟金融交易)中寻找更明确的生存空间;第三,三星电子等存储厂商的 HBM 产能扩张节奏,以及价格走势是否会进一步压制 SRAM 方案的性价比优势。
来源:Readhub · AI


