
a5c-ai / 保姆
一句话看懂:开源项目 Babysitter(保姆)为 AI Agent 工作流提供了确定性编排引擎,通过代码级流程控制和不可篡改日志,解决多 Agent 协同中常见的幻觉和不可控问题,让 AI 按预设流程执行每一步。
事件核心:发生了什么
GitHub 上的 a5c-ai 团队发布了开源工具 Babysitter,目的是让 AI Agent 按预定流程执行复杂任务。该工具的核心思路是“用代码定义流程”:开发者写好流程后,Babysitter 在每一步都进行质量门禁检查,只有通过后才允许进入下一步;关键节点需要人类审批;所有决策都会写入一个不可篡改的日志。安装方面,Babysitter 提供了针对 Claude Code(推荐)、Codex CLI、Cursor、Gemini CLI、GitHub Copilot 等主流 AI 编码工具的插件,也包括一个无需外部 Agent 的“internal harness”,可用于 CI/CD 流水线和自动化测试场景。其插件系统比较特别——插件不是代码模块,而是一套 Markdown 或 JS 指令,AI Agent 本身就是运行环境,理论上插件可以让 Agent 做任何事,比如安装依赖、生成 Terraform 配置、设置 Git Hooks 等。
为什么重要
当前 AI Agent 的主要痛点是“不可控”:代理在生成代码或执行任务时可能偏离原始指令,产生幻觉,且多 Agent 协同中难以追踪每一步的决定。Babysitter 的方向是“确定性自我编排”——不让 AI 自主决策流程,而是让流程约束 AI。这种做法本质上是在 Agent 和用户之间建立一套可审计的契约,让企业级用户在部署 Agent 时更有信心。对 AI 工程化落地而言,这样的确定性工具可能比继续提升模型参数更有实际价值。
对用户/开发者/创作者的影响
对于使用 AI 编码工具的开发者,Babysitter 提供了一个现成的流程强制框架,可以在不改变工具链的情况下约束 Agent 行为;对于技术团队,它降低了多 Agent 协同的管理复杂度——不必担心 Agent 做出意料之外的操作;对于企业级采购方,Babysitter 的不可篡改日志和审批机制,满足了合规和审计要求;对于创作者,Babysitter 的插件系统意味着 AI 可以按明确指令执行创意流程(比如生成时遵循特定风格规范),但当前更偏向代码和 DevOps 场景。扩展支持仍在实验阶段。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
一是 Babysitter 能否从“编码辅助”扩展到通用工作流场景,比如自动化报告生成或复杂数据处理;二是其插件生态是否真正活跃——因为插件本质上依赖 AI Agent 的能力,如果 Agent 本身能力不够,插件效果会受限;三是竞品(比如其他 Agent 编排框架或企业自建方案)是否会快速跟进类似“确定性约束”机制;四是内部 harness 对 CI/CD 的集成程度以及是否能稳定处理多 Agent 任务委派——目前这个功能还标注为 Beta 状态。


