Hermes Agent 加入工具搜索,「AI 养马」更省 tokens

Hermes Agent 加入工具搜索,「AI 养马」更省 tokens

Hermes Agent 加入工具搜索,「AI 养马」更省 tokens

一句话看懂:Nous Research 为开源 AI 智能体 Hermes Agent 加入了工具搜索(Tool Search)功能,让模型按需加载工具描述,而非一次性塞满上下文。这直接解决了大模型在调用 MCP(模型上下文协议)工具时,因工具列表过长导致的 token 浪费和决策混乱问题。

事件核心:发生了什么

科技媒体 marktechpost 于 5 月 29 日报道,Nous Research 为其开源智能体 Hermes Agent 新增了 Tool Search 功能。该功能本质上是引入一个渐进式披露层:模型不再预先加载所有工具的结构定义,而是通过三个桥接工具——tool_search(搜索)、tool_describe(加载完整模式)、tool_call(调用真实工具)——按需逐轮获取所需工具信息。根据 Anthropic 的数据,在包含 5 台 MCP 服务器和 34 个工具的部署中,平均每回合提示符大小为 45000 tokens,其中约 50%(约 22000 tokens)纯粹是工具模式的开销。更极端情况下,工具定义可消耗 134000 tokens。这种“MCP 工具税”不仅导致会话初始缓存未命中时消耗 0.07 至 0.10 美元,还会因模型面对大量无关工具选项出现“决策瘫痪”,降低准确率。启用 Tool Search 后,Anthropic 内部评测显示,Claude Opus 4 的准确率从 49% 提升至 74%,Claude Opus 4.5 从 79.5% 提升至 88.1%。检索层采用 BM25 算法,若未返回正分结果,则退回到工具名字面子串匹配。

为什么重要

这一改进直接指向当前 AI 智能体部署中的一个核心瓶颈:随着工具生态(如 MCP 服务器)扩大,上下文窗口被工具定义大量占用,导致成本飙升和模型判断力下降。Hermes Agent 的 Tool Search 通过按需加载,在技术路线上提供了一种轻量且可落地的解决方案,降低了智能体在复杂工具环境下的部署门槛。对开源社区而言,这意味着开发者可以更高效地构建多工具协作的 AI 工作流,而不会因为工具列表过长而频繁触发 token 上限。Anthropic 的数据也间接佐证,减少无关工具信息能显著提升模型选择准确率,这对依赖智能体完成关键任务的场景(如代码生成、自动化运维)具有实际价值。

对用户/开发者/创作者的影响

对于开发者和技术团队,Tool Search 直接降低了集成多工具时的 token 消耗。具体表现为:会话初期缓存未命中成本降低,且模型在调用诸如 GitHub 事件创建等具体任务时,不必遍历全部工具列表,误选概率下降。创作者或普通用户(如通过 QQ 等接口间接使用 Hermes Agent 的用户)可能感受到的是更流畅的交互体验和更低的调用延迟。此外,该功能以开源形式提供,开发者可通过修改 hermes.yaml 配置文件中的 tool_search 参数(如 threshold_pct 控制自动触发阈值,search_default_limit 控制返回结果数量)来灵活适配自身场景。对于企业采购决策者,这是一个降低推理成本和提升智能体可靠性的技术信号。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

首先,Tool Search 是否会被其他主流智能体框架(如 LangChain、AutoGPT)采纳或借鉴,将决定其生态影响力。其次,BM25 作为基础检索算法,在复杂语义匹配上的表现值得观察——如果工具描述高度相似或同义词多样,是否会引入新的召回瓶颈。第三,目前公开信息显示,该功能仍以“auto”模式(基于上下文占比自动触发)为主,未来是否会引入更智能的动态阈值调整或学习型检索器,将是技术演进方向。

来源:Readhub · AI

celebrityanime
celebrityanime
文章: 4537

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注