谷歌在 Next ’26 大会上宣布推出 GKE Agent Sandbox 和 Hypercluster，并将 Kubernetes 定位为 AI 代理

一句话看懂：谷歌在 Cloud Next ’26 上推出 GKE Agent Sandbox 和 hypercluster，为 AI Agent 提供安全执行环境，并试图将 Kubernetes 打造成 AI 时代的操作系统。此举直接回应了多智能体工作流爆发和 Agent 安全隔离的迫切需求。

事件核心：发生了什么

谷歌宣布了 Google Kubernetes Engine（GKE）的多项更新。最引人注目的是 GKE Agent Sandbox，它使用 gVisor（保障 Gemini 安全的内核级沙箱技术）为不受信任的 Agent 代码提供隔离执行环境。谷歌声称每秒可创建 300 个沙箱，延迟低于一秒，并在 Axion 芯片上实现性价比高于其他超大规模云 30%。该服务作为 Kubernetes SIG Apps 子项目开源，引入 Sandbox、SandboxTemplate、SandboxClaim 三种新原语。同时，GKE Hypercluster 进入私有预览版，允许单个控制平面管理跨区域 256,000 个节点、多达 100 万个加速器芯片。其他更新包括基于机器学习的 GKE Inference Gateway 预测性延迟优化（首 Token 延迟降低 70%）、自动 KV 缓存存储分层（使 5 万条提示词卸载至 SSD 后可提升近 70% 吞吐量），以及 RL Scheduler 和 RL Sandbox。

为什么重要

这一系列更新反映了行业趋势：根据 Databricks 数据，多智能体 AI 工作流近几个月激增 327%；CNCF 数据显示 66% 企业依赖 Kubernetes 支撑生成式 AI。目前已有 Lovable 平台（每天支持超 20 万个 AI 生成项目）在生产中使用 Agent Sandbox。在三大超大规模云中，GKE Agent Sandbox 是唯一原生 Agent 沙箱方案。它的开源特性意味着任何 Kubernetes 集群都能运行，不仅限于 GKE，这将加速 Agent 生态的标准化。Hypercluster 则直接回应了 AI 训练规模扩大导致的集群割裂问题，但正如谷歌首席架构师指出的，跨区域管理百万芯片带来的影响范围和变更管理挑战仍需审慎对待。

对用户/开发者/创作者的影响

对于开发者，Agent Sandbox 提供了一种安全运行第三方 Agent 代码的标准方案，不必自建隔离基础设施，尤其适合需要执行外部代码的 AI 应用（如代码生成、自动化工作流）。大模型构建商将受益于 hypercluster 的算力统一调度，减少多集群运维成本。使用 GKE Inference Gateway 的企业可获得显著的首 Token 延迟降低，对实时交互体验敏感的场景（如对话系统、API 响应）体验提升明显。KV 缓存分层对长上下文推理场景有实际助益，可缓解内存瓶颈。对于使用其他 Kubernetes 平台的用户，Agent Sandbox 作为开源组件也值得关注。

值得关注的后续

首先，Agent Sandbox 目前处于开源早期阶段，实际生产中的安全边界突破案例和性能基准需要更多社区验证。其次，GKE Hypercluster 的私有 GA 状态意味着短期内只有少数大型客户可用，其是否以及何时公开可用仍需观察。最后，Cloudflare 和 E2B 等竞品也在 Agent 沙箱领域布局，开源 vs 专有、边缘 vs 云端的技术路线竞争将如何演变值得跟踪。

来源：InfoQ CN

谷歌在 Next ’26 大会上宣布推出 GKE Agent Sandbox 和 Hypercluster，并将 Kubernetes 定位为 AI 代理