英伟达 Vera Rubin 下半年量产推理性能比 Blackwell 高 35 倍

一句话看懂：英伟达CEO黄仁勋在财报电话会议上透露，新一代AI系统Vera Rubin将于2025年下半年开始生产并发货，其推理吞吐量相比当前Blackwell架构提升了35倍，AI工厂营收能力提高10倍，谷歌已成为早期采用者。

事件核心：发生了什么

在最新的财报电话会议上，英伟达CEO黄仁勋宣布，公司计划于2025年下半年开始生产和发货下一代机架级人工智能系统——Vera Rubin。该系统整合了七款专用芯片和五大加速机架，在推理吞吐量上较现有的Blackwell架构提升35倍，AI工厂营收能力提升10倍。值得一提的是，谷歌已开始采用该系统，其XGS裸金属实例可跨多个站点支持多达96万块Rubin GPU。黄仁勋强调，所有前沿模型研发企业都将第一时间采用这一新系统，这是此前Blackwell架构未能实现的局面。英伟达还对Blackwell和Rubin芯片在2025至2027年间实现1万亿美元营收的预测充满信心，并认为Vera Rubin“将比Grace Blackwell更加成功”。此外，英伟达宣布调整季度收益报告方式，将营收划分为数据中心与边缘计算两大板块。

为什么重要

Vera Rubin的量产标志着英伟达在AI算力领域实现了代际跨越，而这次提升的规模远超常规的硬件迭代。推理吞吐量35倍的跃升，直接回应了当前大模型部署中推理成本高、响应慢的关键痛点，意味着企业能以更低的单次推理成本运行更大规模的模型。谷歌的率先采用，也验证了这一系统在超大规模AI负载中的商业可行性。同时，黄仁勋所称“所有前沿模型研发企业都将第一时间采用”，暗示新一代系统有望打破此前Blackwell在部分头部客户中的采用壁垒。从行业竞争角度看，英伟达正以超常规的迭代速度，持续拉大与AMD、英特尔等对手在AI训练与推理基础设施上的差距。

对用户/开发者/创作者的影响

对于开发者而言，Vera Rubin带来的35倍推理吞吐量提升，将直接反映在API调用成本与响应速度上，使用基于英伟达GPU的云服务搭建AI应用时，单位推理成本可能大幅下降，从而让更多复杂的实时推理场景（如多模态对话、长视频分析）变得经济可行。对于AI创作者（如使用图像生成、视频处理工具的用户），大规模的AI工厂营收能力提升10倍，意味着云服务商可能推出更低的计算资源定价或更高的免费额度。对于企业采购者，目前公开信息显示，Vera Rubin仍处于生产前阶段，实际定价和供货时间尚未明确，但英伟达已给出2025-2027年1万亿美元营收的预期，这暗示新一代系统定价可能高于当前Blackwell系列，企业需提前规划算力预算。对于边缘计算场景（如机器人、汽车、AI无线接入网基站），英伟达将边缘计算单独列为财报板块，表明该公司正加大对推理端和物理AI的布局，这将对物联网和自动驾驶领域的开发者产生间接利好。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，Vera Rubin的实际量产时间和首批客户交付情况，尤其是谷歌之外的其他云厂商（如亚马逊、微软、阿里云）是否跟进采用。第二，英伟达将营收拆分为数据中心与边缘计算，未来边缘计算业务的占比和增速值得跟踪，这直接关系到英伟达是否将推理端硬件（如Jetson系列）作为新增长极。第三，Blackwell在当前周期内是否会出现降价或者提前退市，以让位给Vera Rubin，这可能影响现有客户的采购决策。

来源：Readhub · AI

英伟达 Vera Rubin 下半年量产推理性能比 Blackwell 高 35 倍