我将Hermes Agent转变为一个可验证的代理操作系统

我将Hermes Agent转变为一个可验证的代理操作系统

我将Hermes Agent转变为一个可验证的代理操作系统

一句话看懂:开发者 Levashov 在 Hermes Agent 挑战赛中提交了一个非传统作品——不是构建另一个聊天机器人,而是围绕 Hermes Agent 设计了一套“记忆卫生系统”,将代理的状态信息按持久性分层存储,从而把 Hermes 从一个对话助手升级为可验证的“代理操作系统”。这套系统被命名为“可验证代理层”(Verifiable Agent Harness),并在 GitHub 开源。

事件核心:发生了什么

开发者 Levashov 在 dev.to 发文,公开其参加 Hermes Agent 挑战赛的作品。该作品的核心创新是分离代理运行时的“记忆”概念:他认为,长周期运行的代理工作之所以出错,是因为将聊天历史、全局记忆、项目状态、可复用流程、任务所有权和公开副作用全部混入“记忆”这个单一容器。他为此构建了一个仓库本地的“工作纪律”(repo-local harness),围绕 Hermes Agent 做了以下分层:Hermes 记忆只存稳定事实;Hermes 技能存可复用流程;仓库文件存项目级状态与规范;外部任务层 Multica 负责任务所有权;会话搜索用于历史回溯;公开副作用需要人工审批。工作流中,每一步的输出(即制品)都会经过验证,形成“意图→工具动作→制品→验证→证据报告→人工审批”的证据循环(Evidence Loop)。

具体验证场景包括:仓库更新通过读取文件或检查 diff 验证;技能更新通过运行测试验证;任务完成通过 Multica 评论或链接的制品验证。所有外部动作(如推送代码、发布文章)必须在人工审批门后执行。

为什么重要

当前 AI 代理的开发面临一个普遍问题:长期运行的代理容易产生“记忆漂移”,因为不同类型的信息(用户偏好、项目规范、历史对话、任务状态)拥有不同的生命周期,把它们混在一起会导致行为不可预测。这个方案提出了一个可操作的分类学原则:“信息应存储在最低持久性足够覆盖其预期寿命的那一层。”这一原则对代理系统的工程化设计有直接参考价值,尤其是对于构建生产级、可审计的代理工作流。它让代理的承诺从“相信我,我做到了”转变为“这是我的制品,这是它的验证方式”,从而降低了代理行为的不可控风险。本质上,这是将操作系统中的分层存储思想(寄存器→缓存→内存→磁盘→云存储)映射到了代理的信息管理上。

对用户/开发者/创作者的影响

对开发者:如果你正在构建需要长时间运行的 AI 代理(例如自动化代码审查、持续集成、文档生成),这个分层模式和证据循环提供了可以立即采用的工程模板。GitHub 仓库包含了模板文件(AGENTS.md、CLAUDE.md、session-handoff.md 等)和验证脚本(validate_feature_list.py),可以直接作为新项目的脚手架。此外,它与 Multica 这类外部任务系统集成,解决了“本地看板与实际情况脱节”的痛点。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

对创作者/内容自动化用户:如果你使用代理进行内容发布(如自动生成博客、社交媒体帖子),这个系统强制要求人工审批外部副作用的功能,可以防止代理在无监督时公开发布未审核的内容。

对企业采购决策者:这个方案说明了可验证性不是附加功能,而是架构选择。评估代理平台时,可以考察其是否支持按持久性分层存储状态,以及是否提供制品的验证证据。

值得关注的后续

第一,Multica 作为外部任务层是否会开放更广泛的 API,使得其他代理框架也能接入其任务路由机制。第二,这套“证据循环”模式是否会融入 Hermes Agent 的官方版本或成为社区最佳实践——目前公开信息显示它仍是个个人项目。第三,其他代理框架(如 AutoGPT、LangChain Agent)是否会跟进类似的分层记忆方案,也值得追踪。

来源:dev.to

celebrityanime
celebrityanime
文章: 4832

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注