谷歌在 Next ’26 大会上宣布推出 GKE Agent Sandbox 和 Hypercluster,并将 Kubernetes 定位为 AI 代理

谷歌在 Next '26 大会上宣布推出 GKE Agent Sandbox 和 Hypercluster,并将 Kubernetes 定位为 AI 代理

谷歌在 Next ’26 大会上宣布推出 GKE Agent Sandbox 和 Hypercluster,并将 Kubernetes 定位为 AI 代理

一句话看懂:谷歌在 Cloud Next ’26 上推出 GKE Agent Sandbox 和 hypercluster,为 AI Agent 提供安全执行环境,并试图将 Kubernetes 打造成 AI 时代的操作系统。此举直接回应了多智能体工作流爆发和 Agent 安全隔离的迫切需求。

事件核心:发生了什么

谷歌宣布了 Google Kubernetes Engine(GKE)的多项更新。最引人注目的是 GKE Agent Sandbox,它使用 gVisor(保障 Gemini 安全的内核级沙箱技术)为不受信任的 Agent 代码提供隔离执行环境。谷歌声称每秒可创建 300 个沙箱,延迟低于一秒,并在 Axion 芯片上实现性价比高于其他超大规模云 30%。该服务作为 Kubernetes SIG Apps 子项目开源,引入 Sandbox、SandboxTemplate、SandboxClaim 三种新原语。同时,GKE Hypercluster 进入私有预览版,允许单个控制平面管理跨区域 256,000 个节点、多达 100 万个加速器芯片。其他更新包括基于机器学习的 GKE Inference Gateway 预测性延迟优化(首 Token 延迟降低 70%)、自动 KV 缓存存储分层(使 5 万条提示词卸载至 SSD 后可提升近 70% 吞吐量),以及 RL Scheduler 和 RL Sandbox。

为什么重要

这一系列更新反映了行业趋势:根据 Databricks 数据,多智能体 AI 工作流近几个月激增 327%;CNCF 数据显示 66% 企业依赖 Kubernetes 支撑生成式 AI。目前已有 Lovable 平台(每天支持超 20 万个 AI 生成项目)在生产中使用 Agent Sandbox。在三大超大规模云中,GKE Agent Sandbox 是唯一原生 Agent 沙箱方案。它的开源特性意味着任何 Kubernetes 集群都能运行,不仅限于 GKE,这将加速 Agent 生态的标准化。Hypercluster 则直接回应了 AI 训练规模扩大导致的集群割裂问题,但正如谷歌首席架构师指出的,跨区域管理百万芯片带来的影响范围和变更管理挑战仍需审慎对待。

对用户/开发者/创作者的影响

对于开发者,Agent Sandbox 提供了一种安全运行第三方 Agent 代码的标准方案,不必自建隔离基础设施,尤其适合需要执行外部代码的 AI 应用(如代码生成、自动化工作流)。大模型构建商将受益于 hypercluster 的算力统一调度,减少多集群运维成本。使用 GKE Inference Gateway 的企业可获得显著的首 Token 延迟降低,对实时交互体验敏感的场景(如对话系统、API 响应)体验提升明显。KV 缓存分层对长上下文推理场景有实际助益,可缓解内存瓶颈。对于使用其他 Kubernetes 平台的用户,Agent Sandbox 作为开源组件也值得关注。

值得关注的后续

首先,Agent Sandbox 目前处于开源早期阶段,实际生产中的安全边界突破案例和性能基准需要更多社区验证。其次,GKE Hypercluster 的私有 GA 状态意味着短期内只有少数大型客户可用,其是否以及何时公开可用仍需观察。最后,Cloudflare 和 E2B 等竞品也在 Agent 沙箱领域布局,开源 vs 专有、边缘 vs 云端的技术路线竞争将如何演变值得跟踪。

来源:InfoQ CN

celebrityanime
celebrityanime
文章: 6217

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注