Hermes Agent 加入工具搜索，「AI 养马」更省 tokens

一句话看懂：Nous Research 为开源 AI 智能体 Hermes Agent 加入了工具搜索（Tool Search）功能，让模型按需加载工具描述，而非一次性塞满上下文。这直接解决了大模型在调用 MCP（模型上下文协议）工具时，因工具列表过长导致的 token 浪费和决策混乱问题。

事件核心：发生了什么

科技媒体 marktechpost 于 5 月 29 日报道，Nous Research 为其开源智能体 Hermes Agent 新增了 Tool Search 功能。该功能本质上是引入一个渐进式披露层：模型不再预先加载所有工具的结构定义，而是通过三个桥接工具——tool_search（搜索）、tool_describe（加载完整模式）、tool_call（调用真实工具）——按需逐轮获取所需工具信息。根据 Anthropic 的数据，在包含 5 台 MCP 服务器和 34 个工具的部署中，平均每回合提示符大小为 45000 tokens，其中约 50%（约 22000 tokens）纯粹是工具模式的开销。更极端情况下，工具定义可消耗 134000 tokens。这种“MCP 工具税”不仅导致会话初始缓存未命中时消耗 0.07 至 0.10 美元，还会因模型面对大量无关工具选项出现“决策瘫痪”，降低准确率。启用 Tool Search 后，Anthropic 内部评测显示，Claude Opus 4 的准确率从 49% 提升至 74%，Claude Opus 4.5 从 79.5% 提升至 88.1%。检索层采用 BM25 算法，若未返回正分结果，则退回到工具名字面子串匹配。

为什么重要

这一改进直接指向当前 AI 智能体部署中的一个核心瓶颈：随着工具生态（如 MCP 服务器）扩大，上下文窗口被工具定义大量占用，导致成本飙升和模型判断力下降。Hermes Agent 的 Tool Search 通过按需加载，在技术路线上提供了一种轻量且可落地的解决方案，降低了智能体在复杂工具环境下的部署门槛。对开源社区而言，这意味着开发者可以更高效地构建多工具协作的 AI 工作流，而不会因为工具列表过长而频繁触发 token 上限。Anthropic 的数据也间接佐证，减少无关工具信息能显著提升模型选择准确率，这对依赖智能体完成关键任务的场景（如代码生成、自动化运维）具有实际价值。

对用户/开发者/创作者的影响

对于开发者和技术团队，Tool Search 直接降低了集成多工具时的 token 消耗。具体表现为：会话初期缓存未命中成本降低，且模型在调用诸如 GitHub 事件创建等具体任务时，不必遍历全部工具列表，误选概率下降。创作者或普通用户（如通过 QQ 等接口间接使用 Hermes Agent 的用户）可能感受到的是更流畅的交互体验和更低的调用延迟。此外，该功能以开源形式提供，开发者可通过修改 hermes.yaml 配置文件中的 tool_search 参数（如 threshold_pct 控制自动触发阈值，search_default_limit 控制返回结果数量）来灵活适配自身场景。对于企业采购决策者，这是一个降低推理成本和提升智能体可靠性的技术信号。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

首先，Tool Search 是否会被其他主流智能体框架（如 LangChain、AutoGPT）采纳或借鉴，将决定其生态影响力。其次，BM25 作为基础检索算法，在复杂语义匹配上的表现值得观察——如果工具描述高度相似或同义词多样，是否会引入新的召回瓶颈。第三，目前公开信息显示，该功能仍以“auto”模式（基于上下文占比自动触发）为主，未来是否会引入更智能的动态阈值调整或学习型检索器，将是技术演进方向。

来源：Readhub · AI

Hermes Agent 加入工具搜索，「AI 养马」更省 tokens