
英伟达 Vera Rubin 下半年量产 推理性能比 Blackwell 高 35 倍
一句话看懂:英伟达CEO黄仁勋在财报电话会议上透露,新一代AI系统Vera Rubin将于2025年下半年开始生产并发货,其推理吞吐量相比当前Blackwell架构提升了35倍,AI工厂营收能力提高10倍,谷歌已成为早期采用者。
事件核心:发生了什么
在最新的财报电话会议上,英伟达CEO黄仁勋宣布,公司计划于2025年下半年开始生产和发货下一代机架级人工智能系统——Vera Rubin。该系统整合了七款专用芯片和五大加速机架,在推理吞吐量上较现有的Blackwell架构提升35倍,AI工厂营收能力提升10倍。值得一提的是,谷歌已开始采用该系统,其XGS裸金属实例可跨多个站点支持多达96万块Rubin GPU。黄仁勋强调,所有前沿模型研发企业都将第一时间采用这一新系统,这是此前Blackwell架构未能实现的局面。英伟达还对Blackwell和Rubin芯片在2025至2027年间实现1万亿美元营收的预测充满信心,并认为Vera Rubin“将比Grace Blackwell更加成功”。此外,英伟达宣布调整季度收益报告方式,将营收划分为数据中心与边缘计算两大板块。
为什么重要
Vera Rubin的量产标志着英伟达在AI算力领域实现了代际跨越,而这次提升的规模远超常规的硬件迭代。推理吞吐量35倍的跃升,直接回应了当前大模型部署中推理成本高、响应慢的关键痛点,意味着企业能以更低的单次推理成本运行更大规模的模型。谷歌的率先采用,也验证了这一系统在超大规模AI负载中的商业可行性。同时,黄仁勋所称“所有前沿模型研发企业都将第一时间采用”,暗示新一代系统有望打破此前Blackwell在部分头部客户中的采用壁垒。从行业竞争角度看,英伟达正以超常规的迭代速度,持续拉大与AMD、英特尔等对手在AI训练与推理基础设施上的差距。
对用户/开发者/创作者的影响
对于开发者而言,Vera Rubin带来的35倍推理吞吐量提升,将直接反映在API调用成本与响应速度上,使用基于英伟达GPU的云服务搭建AI应用时,单位推理成本可能大幅下降,从而让更多复杂的实时推理场景(如多模态对话、长视频分析)变得经济可行。对于AI创作者(如使用图像生成、视频处理工具的用户),大规模的AI工厂营收能力提升10倍,意味着云服务商可能推出更低的计算资源定价或更高的免费额度。对于企业采购者,目前公开信息显示,Vera Rubin仍处于生产前阶段,实际定价和供货时间尚未明确,但英伟达已给出2025-2027年1万亿美元营收的预期,这暗示新一代系统定价可能高于当前Blackwell系列,企业需提前规划算力预算。对于边缘计算场景(如机器人、汽车、AI无线接入网基站),英伟达将边缘计算单独列为财报板块,表明该公司正加大对推理端和物理AI的布局,这将对物联网和自动驾驶领域的开发者产生间接利好。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,Vera Rubin的实际量产时间和首批客户交付情况,尤其是谷歌之外的其他云厂商(如亚马逊、微软、阿里云)是否跟进采用。第二,英伟达将营收拆分为数据中心与边缘计算,未来边缘计算业务的占比和增速值得跟踪,这直接关系到英伟达是否将推理端硬件(如Jetson系列)作为新增长极。第三,Blackwell在当前周期内是否会出现降价或者提前退市,以让位给Vera Rubin,这可能影响现有客户的采购决策。
来源:Readhub · AI


