我将Hermes Agent转变为一个可验证的代理操作系统

一句话看懂：开发者 Levashov 在 Hermes Agent 挑战赛中提交了一个非传统作品——不是构建另一个聊天机器人，而是围绕 Hermes Agent 设计了一套“记忆卫生系统”，将代理的状态信息按持久性分层存储，从而把 Hermes 从一个对话助手升级为可验证的“代理操作系统”。这套系统被命名为“可验证代理层”（Verifiable Agent Harness），并在 GitHub 开源。

事件核心：发生了什么

开发者 Levashov 在 dev.to 发文，公开其参加 Hermes Agent 挑战赛的作品。该作品的核心创新是分离代理运行时的“记忆”概念：他认为，长周期运行的代理工作之所以出错，是因为将聊天历史、全局记忆、项目状态、可复用流程、任务所有权和公开副作用全部混入“记忆”这个单一容器。他为此构建了一个仓库本地的“工作纪律”（repo-local harness），围绕 Hermes Agent 做了以下分层：Hermes 记忆只存稳定事实；Hermes 技能存可复用流程；仓库文件存项目级状态与规范；外部任务层 Multica 负责任务所有权；会话搜索用于历史回溯；公开副作用需要人工审批。工作流中，每一步的输出（即制品）都会经过验证，形成“意图→工具动作→制品→验证→证据报告→人工审批”的证据循环（Evidence Loop）。

具体验证场景包括：仓库更新通过读取文件或检查 diff 验证；技能更新通过运行测试验证；任务完成通过 Multica 评论或链接的制品验证。所有外部动作（如推送代码、发布文章）必须在人工审批门后执行。

为什么重要

当前 AI 代理的开发面临一个普遍问题：长期运行的代理容易产生“记忆漂移”，因为不同类型的信息（用户偏好、项目规范、历史对话、任务状态）拥有不同的生命周期，把它们混在一起会导致行为不可预测。这个方案提出了一个可操作的分类学原则：“信息应存储在最低持久性足够覆盖其预期寿命的那一层。”这一原则对代理系统的工程化设计有直接参考价值，尤其是对于构建生产级、可审计的代理工作流。它让代理的承诺从“相信我，我做到了”转变为“这是我的制品，这是它的验证方式”，从而降低了代理行为的不可控风险。本质上，这是将操作系统中的分层存储思想（寄存器→缓存→内存→磁盘→云存储）映射到了代理的信息管理上。

对用户/开发者/创作者的影响

对开发者：如果你正在构建需要长时间运行的 AI 代理（例如自动化代码审查、持续集成、文档生成），这个分层模式和证据循环提供了可以立即采用的工程模板。GitHub 仓库包含了模板文件（AGENTS.md、CLAUDE.md、session-handoff.md 等）和验证脚本（validate_feature_list.py），可以直接作为新项目的脚手架。此外，它与 Multica 这类外部任务系统集成，解决了“本地看板与实际情况脱节”的痛点。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

对创作者/内容自动化用户：如果你使用代理进行内容发布（如自动生成博客、社交媒体帖子），这个系统强制要求人工审批外部副作用的功能，可以防止代理在无监督时公开发布未审核的内容。

对企业采购决策者：这个方案说明了可验证性不是附加功能，而是架构选择。评估代理平台时，可以考察其是否支持按持久性分层存储状态，以及是否提供制品的验证证据。

值得关注的后续

第一，Multica 作为外部任务层是否会开放更广泛的 API，使得其他代理框架也能接入其任务路由机制。第二，这套“证据循环”模式是否会融入 Hermes Agent 的官方版本或成为社区最佳实践——目前公开信息显示它仍是个个人项目。第三，其他代理框架（如 AutoGPT、LangChain Agent）是否会跟进类似的分层记忆方案，也值得追踪。

来源：dev.to

我将Hermes Agent转变为一个可验证的代理操作系统