
英伟达宣布向 Anthropic、OpenAI、SpaceXAI、甲骨文交付首批 Vera CPU
一句话看懂:英伟达已于5月19日正式向Anthropic、OpenAI、SpaceXAI和甲骨文交付首批专为Agentic AI设计的Vera CPU,标志着这款自研定制处理器进入量产阶段,并为后续大规模部署打下基础。
事件核心:发生了什么
英伟达超大规模与高性能计算副总裁伊恩·巴克亲手将首批Vera CPU系统交付给四大客户:Anthropic(在旧金山SoMa办公室)、OpenAI(在Mission Bay总部)、马斯克旗下的SpaceXAI(在帕洛阿尔托办公室),以及甲骨文云基础设施(OCI)。Vera是英伟达首款定制CPU,基于自研奥林巴斯(Olympus)架构,配备88个核心、176个线程,内存带宽达1.2 TB/s,单核性能比前代Grace快50%,并采用LPDDR5X内存以提升每瓦性能。甲骨文计划从2026年开始部署数十万颗Vera CPU,成为首家超大规模部署的云服务商。Vera不仅集成在Vera Rubin NVL72平台中,也可独立发货,预计将为英伟达开辟数十亿美元的新业务。
为什么重要
Vera CPU的交付意味着英伟达正从GPU主导的AI硬件供应商,向CPU+GPU协同计算平台转型。英伟达指出,随着AI模型从回答问题转向执行复杂任务(如生成Python代码),CPU需求飙升,因为智能体(Agent)工作负载对数据编排、控制和代码执行的CPU性能要求极高。Vera专门为此设计,提供高单线程性能、大内存带宽和高能效,有助于在推理和强化学习等场景中维持规模化性能。这对持续依赖英伟达生态的AI公司(如OpenAI、Anthropic)和云服务商(甲骨文)而言,是解决算力瓶颈的关键一步,也将迫使AMD、英特尔等对手加速定制化CPU研发。
对用户/开发者/创作者的影响
对开发者而言,Vera CPU的高性能核心和1.5 TB系统内存(是Grace的3倍)将显著提升数据处理、压缩和CI/CD管道效率,尤其是在Agentic AI应用(如自动化代码生成、仿真管道)中,可能带来更低的推理延迟和更高的任务吞吐量。对使用Anthropic、OpenAI API的企业,随着模型底层硬件升级,响应速度和可靠性有望间接改善。对云服务商用户(如甲骨文客户),Vera的能效优势可能转化为更低的算力成本和更优化的部署密度。但对普通创作者(如使用图像生成工具的用户),Vera的直接影响相对间接,更多体现在降低AI服务运营成本上。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,Vera CPU的大规模量产和Vera Rubin平台(预计本周后半段发布)能否在2025年7月前向主要客户出货,是判断英伟达供应能力的关键。第二,甲骨文“数十万颗Vera CPU”部署计划的具体落地时间与性能实测数据,将直接影响云计算市场竞价格局。第三,竞争对手方面,AMD和英特尔是否会推出针对Agentic AI的定制CPU,或通过DPU/FPGA等替代方案响应,值得持续跟踪。


