a5c-ai / 保姆

一句话看懂：开源项目 Babysitter（保姆）为 AI Agent 工作流提供了确定性编排引擎，通过代码级流程控制和不可篡改日志，解决多 Agent 协同中常见的幻觉和不可控问题，让 AI 按预设流程执行每一步。

事件核心：发生了什么

GitHub 上的 a5c-ai 团队发布了开源工具 Babysitter，目的是让 AI Agent 按预定流程执行复杂任务。该工具的核心思路是“用代码定义流程”：开发者写好流程后，Babysitter 在每一步都进行质量门禁检查，只有通过后才允许进入下一步；关键节点需要人类审批；所有决策都会写入一个不可篡改的日志。安装方面，Babysitter 提供了针对 Claude Code（推荐）、Codex CLI、Cursor、Gemini CLI、GitHub Copilot 等主流 AI 编码工具的插件，也包括一个无需外部 Agent 的“internal harness”，可用于 CI/CD 流水线和自动化测试场景。其插件系统比较特别——插件不是代码模块，而是一套 Markdown 或 JS 指令，AI Agent 本身就是运行环境，理论上插件可以让 Agent 做任何事，比如安装依赖、生成 Terraform 配置、设置 Git Hooks 等。

为什么重要

当前 AI Agent 的主要痛点是“不可控”：代理在生成代码或执行任务时可能偏离原始指令，产生幻觉，且多 Agent 协同中难以追踪每一步的决定。Babysitter 的方向是“确定性自我编排”——不让 AI 自主决策流程，而是让流程约束 AI。这种做法本质上是在 Agent 和用户之间建立一套可审计的契约，让企业级用户在部署 Agent 时更有信心。对 AI 工程化落地而言，这样的确定性工具可能比继续提升模型参数更有实际价值。

对用户/开发者/创作者的影响

对于使用 AI 编码工具的开发者，Babysitter 提供了一个现成的流程强制框架，可以在不改变工具链的情况下约束 Agent 行为；对于技术团队，它降低了多 Agent 协同的管理复杂度——不必担心 Agent 做出意料之外的操作；对于企业级采购方，Babysitter 的不可篡改日志和审批机制，满足了合规和审计要求；对于创作者，Babysitter 的插件系统意味着 AI 可以按明确指令执行创意流程（比如生成时遵循特定风格规范），但当前更偏向代码和 DevOps 场景。扩展支持仍在实验阶段。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

一是 Babysitter 能否从“编码辅助”扩展到通用工作流场景，比如自动化报告生成或复杂数据处理；二是其插件生态是否真正活跃——因为插件本质上依赖 AI Agent 的能力，如果 Agent 本身能力不够，插件效果会受限；三是竞品（比如其他 Agent 编排框架或企业自建方案）是否会快速跟进类似“确定性约束”机制；四是内部 harness 对 CI/CD 的集成程度以及是否能稳定处理多 Agent 任务委派——目前这个功能还标注为 Beta 状态。

来源：GitHub · Trending Today

a5c-ai / 保姆

a5c-ai / 保姆

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

a5c-ai / 保姆

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

DeepSeek V4 Flash 已上线 OpenCode Zen

Codex 刚刚找到了我的电脑上没有 sudo 的“解决方法”

这是我六月最推荐购买的人工智能（AI）股票（提示：不是美光科技）

发表回复取消回复