Google 想为 AI Agent 打造下一个 Kubernetes

Google 开源了两个新项目 Agent Substrate 和 Agent eXecutor(AX),旨在为 AI Agent 工作负载提供类似 Kubernetes 的编排能力,核心是通过“零空闲”架构将 Agent 的生命周期与硬件资源解耦,从而大幅提升硬件效率——在突发性工作负载下节省高达 97%…

Google 想为 AI Agent 打造下一个 Kubernetes

一句话看懂:Google 开源了两个新项目 Agent Substrate 和 Agent eXecutor(AX),旨在为 AI Agent 工作负载提供类似 Kubernetes 的编排能力,核心是通过“零空闲”架构将 Agent 的生命周期与硬件资源解耦,从而大幅提升硬件效率——在突发性工作负载下节省高达 97% 的资源。

事件核心:发生了什么

5 月下旬,Google 在 Apache 2.0 许可证下开源了 Agent Substrate(v0.0.0)和 AX(v0.1.0)。Agent Substrate 是一个位于 Kubernetes 之上的轻量级控制平面,专门处理 Agent 的挂起、恢复和调度;AX 则是其上的运行时,负责协调 Agent 执行循环、事件日志管理以及与本地和远程 Actor 通信。演示显示,在 Agent 等待人类输入或外部工具的典型突发负载中,最多 30 个逻辑 Agent 会话可以共享同一份物理执行容量,避免传统模型中每会话独占容器造成的空闲资源浪费。项目仍处早期,不保证向后兼容。Google 强调思路类似 Kubernetes 早期——先开放核心组件,依靠社区推动成熟。

为什么重要

当前 AI Agent 部署面临一个结构性矛盾:Kubernetes 擅长编排长期稳定的服务,但 Agent 工作负载具有高度突发性——大量时间花在等待外部事件上,导致计算资源闲置。Google 的方案没有重新发明容器编排,而是在 Kubernetes 之上增加一层 Agent 专属控制能力,将非活跃 Agent 状态快照保存、释放计算资源,恢复时仅需几百毫秒而非冷启动的秒级等待。这直接冲击了为 Agent 扩展买单的常规思路:如果企业运行着数千个 Agent 会话,但大部分时间处于等待状态,硬件效率的提升将直接转化为成本削减。Google 选择的 Apache 2.0 许可证和“厂商中立、可移植”的定位,也与 Kubernetes 当年吸引社区参与的策略一致。

对用户/开发者/创作者的影响

对于使用 API 的开发者,目前暂无直接变化,该项目仍属基础设施层,不涉及模型推理速度的改善。对于部署 Agent 的企业 IT 团队,这是值得关注的技术方向:一旦成熟,可以显著降低大规模 Agent 集群的硬件成本——对于等待人类审批、工具响应等高频等待场景尤为适用。对于使用 Google Cloud 服务的用户,AX 已内置 Gemini Agent,且计划与 Google Antigravity Agentic 开发平台集成;长期看,该技术可能影响云服务计费模式,因为资源可以更高效复用。创作者和普通用户短期内不会感知到变化,但 Agent 响应速度可能受益于更快的恢复机制。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

以下是几个具体观察点:
1. 产品落地时间表:两个项目目前是 v0.0.0 和 v0.1.0 版本,文档明确提示“一切可能变化”,何时进入 beta 或正式版尚不明确。
2. 社区生态发展:Apache 2.0 许可证降低了企业采用门槛,但项目能否吸引到足够贡献者来推动成熟,仍待观察。
3. 厂商跟进动态:如果 Agent Substrate 模式被证明有效,其他云厂商(AWS、Azure)是否会推出类似方案,或出现基于此的第三方工具链。

来源:InfoQ CN

celebrityanime
celebrityanime
文章: 8534

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注