Show HN: Semble——一款面向代理的代码搜索工具，其使用的令牌数量比 grep 少 98%

一句话看懂：开发团队 MinishLab 在 Hacker News 上发布了开源工具 Semble，它专为 AI 代码代理（如 Claude Code、Cursor）设计，能在 CPU 上以极低的令牌消耗和毫秒级延迟完成代码搜索。相比传统 grep+读取文件的方式，其令牌使用量减少了约 98%。

事件核心：发生了什么

Semble 是一个轻量级的代码搜索库，核心能力是让 AI 代理用自然语言（如“认证流程是怎么实现的？”）直接查询代码库，返回精确的代码片段，而不是像 grep 一样逐行匹配后再读取整个文件。根据项目 README 中的基准测试数据，Semble 索引一个普通仓库平均耗时约 250 毫秒，单次查询约 1.5 毫秒；在 NDCG@10 指标上达到 0.854，接近专门的代码 transformer 模型，但索引速度快约 200 倍、查询速度快约 10 倍。它完全运行在 CPU 上，无需 API 密钥或 GPU。Semble 支持作为 MCP（模型上下文协议）服务器集成到 Claude Code、Codex、OpenCode、Cursor 等代理中，也可通过 Bash 添加至 AGENTS.md 文件实现调用。

为什么重要

Semble 的发布针对的是当前 AI 编程代理落地中的一个现实痛点：大模型在访问代码库时，若采用传统搜索方式会产生大量无意义的令牌消耗，既增加推理成本又拖慢响应速度。grep+read 模式需要读取大量不相关的代码行，而 Semble 通过语义检索直接切出相关代码块，大幅压缩输入令牌数，且不依赖云端模型或专用硬件。这一思路让本地化、低成本的代理代码搜索成为可能，尤其适合需要频繁访问大型代码库的自动化开发场景。目前公开信息显示，它在检索质量上与专用 transformer 模型相当，但实际表现仍需更多社区验证。

对用户/开发者/创作者的影响

对于使用 Claude Code、Cursor 等工具的 AI 编程用户，Semble 能直接降低代理在理解代码结构时的令牌开销，从而减少调用成本和延迟。对于维护大型代码库的团队，它可以减少代理因读取无关文件而导致的幻觉或上下文溢出问题。对于工具开发者而言，Semble 的 MCP 服务器架构提供了一个插件化的代码搜索解决方案，可以嵌入到自定义工作流中。项目已开源（GitHub 仓库 MinishLab/semble），开发者可以自行部署并观察 token 节省情况（命令 “semble savings”），无需外部服务依赖。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，Semble 当前仍为早期开源项目，其检索质量在复杂、罕见术语或混合语言代码库中的表现值得进一步验证。第二，如果被主流代理开发工具（如 Claude Code、Cursor）直接采纳或预装，可能改变现有代码搜索工具在 AI 编程生态中的格局。第三，开源模型社区是否会跟进类似思路，推出更低成本的本地代码搜索方案，也将影响这一方向的普及速度。

来源：Hacker News

Show HN: Semble——一款面向代理的代码搜索工具，其使用的令牌数量比 grep 少 98%