
从端侧到云端统一加速:英伟达、微软展示 AI 智能体完整部署栈,Fairwater 工厂提前上线
一句话看懂:在微软 Build 2026 大会上,英伟达与微软联合展示了从 Windows 设备到 Azure 云的 AI 智能体部署全栈方案,推出面向个人智能体的 RTX Spark 桌面平台,并宣布微软 Fairwater AI 工厂已提前上线,运行数十万套英伟达 Grace Blackwell 系统。
事件核心:发生了什么
在今日开幕的微软 Build 2026 大会上,英伟达 CEO 黄仁勋与微软 CEO 萨提亚·纳德拉共同公布了多项合作成果。双方宣布推出面向 AI 智能体时代的 PC 平台 RTX Spark,提供 1 petaflop AI 算力和最高 128GB 统一内存,支持离电不衰减性能,今秋将由微软 Surface、华硕、戴尔等厂商推出。同时,性能更强的桌面级 AI 超级计算机 DGX Station for Windows 搭载英伟达 GB300 Grace Blackwell Ultra 芯片,配备最高 748GB 统一内存和 20 petaflops FP4 性能,预计第四季度上市。
在模型层,英伟达的 Nemotron 3 Ultra 推理模型、语音识别模型 Nemotron 3.5 ASR 及内容安全模型已登陆微软 Foundry 平台。此外,Anthropic 的 Claude 模型已原生运行于 Azure 上的英伟达 GB300 系统。数据层方面,英伟达加速计算已集成至微软 Fabric Data Warehouse,SQL 执行速度达到 CPU 基线的最高 6 倍。
基础设施层面,微软位于威斯康星州费尔沃特的 AI 工厂提前上线,运行数十万套英伟达 Grace Blackwell 系统,并与佐治亚州同类工厂互联。黄仁勋确认微软部署了最多的 Blackwell 芯片。微软还已完成对英伟达下一代 Vera Rubin 平台的验证,该平台已投产,每兆瓦推理吞吐量提升最高 10 倍,可在不改造前提下与 Blackwell 并行部署。
为什么重要
这次合作不是单一产品发布,而是英伟达与微软在 AI 基础设施层面的一次系统性整合。从端侧 PC 设备到云端数据中心,双方提供了统一的加速计算栈,覆盖训练、推理、数据仓库和物理 AI 场景。对行业而言,这意味着 AI 智能体的部署路径更加清晰:开发者可以在一套 CUDA-X 生态下,从本地开发直接迁移到云上生产环境,无需反复适配。同时,Vera Rubin 平台的提前验证表明,英伟达的新一代数据中心芯片正在快速上量,微软的 AI 算力储备将大幅提升。
对用户/开发者/创作者的影响
对于开发者,英伟达 Agent Toolkit 和 NemoClaw 蓝图已在微软 Foundry 上开源,可直接用于构建生产级 AI 智能体。GitHub Copilot 集成了英伟达 OpenShell 安全运行时,每个智能体在独立沙箱容器中运行,对外调用需经过策略评估,提升了安全性。对于使用 Windows 的创作者和本地 AI 开发者,RTX Spark 提供了高达 128GB 统一内存和 1 petaflop 算力,可在本地运行较大模型,且离电性能无衰减。对于企业用户,Foundry Local 已支持在本地或混合环境中部署英伟达 RTX PRO 6000 Blackwell 服务器,可运行主权或合规要求高的 AI 负载。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,RTX Spark 产品的实际定价和上市时间,目前公开信息显示今秋推出,但具体规格和价格尚未公布;第二,Vera Rubin 平台在 Azure 中的部署进度和定价,它宣称的 10 倍能效提升如果落地,可能影响企业算力采购决策;第三,物理 AI 领域,微软整合英伟达 Cosmos 3 平台后,机器人、自动驾驶等系统的开发工具链是否会开放给第三方,值得开发者关注。


