从端侧到云端统一加速：英伟达、微软展示 AI 智能体完整部署栈，Fairwater 工厂提前上线

一句话看懂：在微软 Build 2026 大会上，英伟达与微软联合展示了从 Windows 设备到 Azure 云的 AI 智能体部署全栈方案，推出面向个人智能体的 RTX Spark 桌面平台，并宣布微软 Fairwater AI 工厂已提前上线，运行数十万套英伟达 Grace Blackwell 系统。

事件核心：发生了什么

在今日开幕的微软 Build 2026 大会上，英伟达 CEO 黄仁勋与微软 CEO 萨提亚·纳德拉共同公布了多项合作成果。双方宣布推出面向 AI 智能体时代的 PC 平台 RTX Spark，提供 1 petaflop AI 算力和最高 128GB 统一内存，支持离电不衰减性能，今秋将由微软 Surface、华硕、戴尔等厂商推出。同时，性能更强的桌面级 AI 超级计算机 DGX Station for Windows 搭载英伟达 GB300 Grace Blackwell Ultra 芯片，配备最高 748GB 统一内存和 20 petaflops FP4 性能，预计第四季度上市。

在模型层，英伟达的 Nemotron 3 Ultra 推理模型、语音识别模型 Nemotron 3.5 ASR 及内容安全模型已登陆微软 Foundry 平台。此外，Anthropic 的 Claude 模型已原生运行于 Azure 上的英伟达 GB300 系统。数据层方面，英伟达加速计算已集成至微软 Fabric Data Warehouse，SQL 执行速度达到 CPU 基线的最高 6 倍。

基础设施层面，微软位于威斯康星州费尔沃特的 AI 工厂提前上线，运行数十万套英伟达 Grace Blackwell 系统，并与佐治亚州同类工厂互联。黄仁勋确认微软部署了最多的 Blackwell 芯片。微软还已完成对英伟达下一代 Vera Rubin 平台的验证，该平台已投产，每兆瓦推理吞吐量提升最高 10 倍，可在不改造前提下与 Blackwell 并行部署。

为什么重要

这次合作不是单一产品发布，而是英伟达与微软在 AI 基础设施层面的一次系统性整合。从端侧 PC 设备到云端数据中心，双方提供了统一的加速计算栈，覆盖训练、推理、数据仓库和物理 AI 场景。对行业而言，这意味着 AI 智能体的部署路径更加清晰：开发者可以在一套 CUDA-X 生态下，从本地开发直接迁移到云上生产环境，无需反复适配。同时，Vera Rubin 平台的提前验证表明，英伟达的新一代数据中心芯片正在快速上量，微软的 AI 算力储备将大幅提升。

对用户/开发者/创作者的影响

对于开发者，英伟达 Agent Toolkit 和 NemoClaw 蓝图已在微软 Foundry 上开源，可直接用于构建生产级 AI 智能体。GitHub Copilot 集成了英伟达 OpenShell 安全运行时，每个智能体在独立沙箱容器中运行，对外调用需经过策略评估，提升了安全性。对于使用 Windows 的创作者和本地 AI 开发者，RTX Spark 提供了高达 128GB 统一内存和 1 petaflop 算力，可在本地运行较大模型，且离电性能无衰减。对于企业用户，Foundry Local 已支持在本地或混合环境中部署英伟达 RTX PRO 6000 Blackwell 服务器，可运行主权或合规要求高的 AI 负载。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，RTX Spark 产品的实际定价和上市时间，目前公开信息显示今秋推出，但具体规格和价格尚未公布；第二，Vera Rubin 平台在 Azure 中的部署进度和定价，它宣称的 10 倍能效提升如果落地，可能影响企业算力采购决策；第三，物理 AI 领域，微软整合英伟达 Cosmos 3 平台后，机器人、自动驾驶等系统的开发工具链是否会开放给第三方，值得开发者关注。

来源：IT之家 (ITHome)

从端侧到云端统一加速：英伟达、微软展示 AI 智能体完整部署栈，Fairwater 工厂提前上线