Show HN: Semble——一款面向代理的代码搜索工具,其使用的令牌数量比 grep 少 98%

Show HN: Semble——一款面向代理的代码搜索工具,其使用的令牌数量比 grep 少 98%

Show HN: Semble——一款面向代理的代码搜索工具,其使用的令牌数量比 grep 少 98%

一句话看懂:开发团队 MinishLab 在 Hacker News 上发布了开源工具 Semble,它专为 AI 代码代理(如 Claude Code、Cursor)设计,能在 CPU 上以极低的令牌消耗和毫秒级延迟完成代码搜索。相比传统 grep+读取文件的方式,其令牌使用量减少了约 98%。

事件核心:发生了什么

Semble 是一个轻量级的代码搜索库,核心能力是让 AI 代理用自然语言(如“认证流程是怎么实现的?”)直接查询代码库,返回精确的代码片段,而不是像 grep 一样逐行匹配后再读取整个文件。根据项目 README 中的基准测试数据,Semble 索引一个普通仓库平均耗时约 250 毫秒,单次查询约 1.5 毫秒;在 NDCG@10 指标上达到 0.854,接近专门的代码 transformer 模型,但索引速度快约 200 倍、查询速度快约 10 倍。它完全运行在 CPU 上,无需 API 密钥或 GPU。Semble 支持作为 MCP(模型上下文协议)服务器集成到 Claude Code、Codex、OpenCode、Cursor 等代理中,也可通过 Bash 添加至 AGENTS.md 文件实现调用。

为什么重要

Semble 的发布针对的是当前 AI 编程代理落地中的一个现实痛点:大模型在访问代码库时,若采用传统搜索方式会产生大量无意义的令牌消耗,既增加推理成本又拖慢响应速度。grep+read 模式需要读取大量不相关的代码行,而 Semble 通过语义检索直接切出相关代码块,大幅压缩输入令牌数,且不依赖云端模型或专用硬件。这一思路让本地化、低成本的代理代码搜索成为可能,尤其适合需要频繁访问大型代码库的自动化开发场景。目前公开信息显示,它在检索质量上与专用 transformer 模型相当,但实际表现仍需更多社区验证。

对用户/开发者/创作者的影响

对于使用 Claude Code、Cursor 等工具的 AI 编程用户,Semble 能直接降低代理在理解代码结构时的令牌开销,从而减少调用成本和延迟。对于维护大型代码库的团队,它可以减少代理因读取无关文件而导致的幻觉或上下文溢出问题。对于工具开发者而言,Semble 的 MCP 服务器架构提供了一个插件化的代码搜索解决方案,可以嵌入到自定义工作流中。项目已开源(GitHub 仓库 MinishLab/semble),开发者可以自行部署并观察 token 节省情况(命令 “semble savings”),无需外部服务依赖。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,Semble 当前仍为早期开源项目,其检索质量在复杂、罕见术语或混合语言代码库中的表现值得进一步验证。第二,如果被主流代理开发工具(如 Claude Code、Cursor)直接采纳或预装,可能改变现有代码搜索工具在 AI 编程生态中的格局。第三,开源模型社区是否会跟进类似思路,推出更低成本的本地代码搜索方案,也将影响这一方向的普及速度。

来源:Hacker News

celebrityanime
celebrityanime
文章: 2512

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注