
格隆汇 5 月 21 日|英伟达 CEO 黄仁勋:包括自身产品在内的基于 SRAM 的 AI 芯片,在一段时间内将是一个小众产品。
一句话看懂:英伟达 CEO 黄仁勋在 5 月 21 日公开指出,包括英伟达自身产品在内的基于 SRAM 技术的 AI 芯片,短期内将只能服务于特定场景,难以成为市场主流。这一表态直接回应了业界对 SRAM 是否将替代 HBM(高带宽内存)的讨论。
事件核心:发生了什么
黄仁勋在格隆汇 5 月 21 日发布的快讯中表示,无论是英伟达的现有产品还是其他厂商的同类方案,基于 SRAM 的 AI 芯片在“一段时间内”都将属于小众产品。SRAM(静态随机存取存储器)是一种速度更快、但成本更高且集成密度远低于 DRAM 的存储技术。在 AI 训练和推理场景中,HBM 因其高带宽和相对合理的成本成为当前主流内存选择,而 SRAM 通常作为芯片上的高速缓存使用。黄仁勋的发言意味着,即使面对市场对 SRAM 架构 AI 芯片潜力的关注,英伟达并不认为它能短期内撼动以 HBM 为核心的内存体系。
为什么重要
这一表态直接影响了 AI 芯片的技术路线和市场竞争预期。此前,部分初创公司和学术研究团队尝试探索 SRAM 作为主力存储的方案,希望以更低的功耗和更低的延迟挑战英伟达在算力领域的统治地位。黄仁勋的定调显示,英伟达认为这些替代方案在成本、规模和生态成熟度上尚不具备商业化竞争力。对于整个 AI 硬件行业而言,这意味着在未来几年内,“HBM + GPU”的架构仍将是算力基础设施的核心选择;而 SRAM 类芯片将主要集中在对功耗比极度敏感、且对成本不敏感的特定领域,例如云端大规模推理任务中的部分低延迟子场景或边缘计算的部分应用。
对用户/开发者/创作者的影响
如果你正在使用或计划部署 AI 大模型(如 GPT、Claude、国产大模型等),短期内不必担心芯片底层架构切换带来的算力空白或成本剧增。英伟达的 CUDA 生态和 HBM 供应链仍将支撑主流的模型训练和推理。但开发者在为特定低延迟或终端设备优化模型时,可以关注基于 SRAM 的专用芯片,这类芯片可能会在图像生成、实时语音交互等对响应时间要求苛刻的场景下,提供更优的性价比。对于普通创作者,当前基于云端的 AI 工具不会因此产生明显波动,因为云端算力仍由大型数据中心通过 HBM 体系提供。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
- 第三方 SRAM 芯片企业是否获得突破性订单: 黄仁勋的判断是否能被实际商业数据推翻?关注是否有类似 Groq 等以 SRAM 为主的芯片厂商获得云端大客户的采购合同。
- 英伟达自身的产品路线图是否有变化: 黄仁勋明确提及“包括自身产品”,是否暗示英伟达未来会继续在部分产品线(如 Grace Hopper 之后的架构)中加入更多 SRAM 颗粒,但仅作为缓存辅助而非主内存?
- HBM 供应链的价格与产能: 如果 SRAM 方案在高温和成本上持续受限,将巩固 SK 海力士、三星等 HBM 供应商的议价能力,间接影响 AI 服务器的采购成本。
来源:Readhub · AI


