RAG 新 SOTA，还在 5 亿条数据上跑进秒级，只有它了

一句话看懂：广州智跃深空人工智能科技有限公司（Zleap AI）提出了一种名为 SAG（SQL-Retrieval Augmented Generation）的新检索增强生成方案，在多跳问答任务上超越 HippoRAG 2 成为新 SOTA，并在 5 亿条数据的生产环境中实现了秒级检索延迟。它用“事件+实体”的数据库结构替代了传统知识图谱，解决了 RAG 在 Agent 时代的多步推理与规模化落地难题。

事件核心：发生了什么

6 月 18 日，Zleap AI 发布了对 SAG 的详细介绍。SAG 的核心思路是：离线阶段，将原始文本拆解为“事件（Event）”和“实体（Entity）”并存入 SQL 与向量索引中；在线查询时，用 SQL join 和向量检索分别找到相关的实体与事件，再通过共享实体将分散的事件临时串联成推理链。

在三个多跳问答数据集（HotpotQA、2WikiMultiHopQA、MuSiQue）上，SAG 的平均 Recall@2 为 79.3%，Recall@5 为 88.2%，领先 HippoRAG 2 约 11 个百分点。在推理难度最高的 MuSiQue 上，SAG 的 Recall@5（80.0%）比 HippoRAG 2（65.1%）高出近 15 个百分点。更重要的是，该方案已在约 5 亿条数据规模的生产环境中部署，检索延迟保持在秒级。

为什么重要

传统 RAG 在 Agent 应用中存在致命缺陷：仅基于向量相似度检索，容易在一步推理中选错材料，导致后续推理链持续跑偏。GraphRAG 通过预建知识图谱改善了关系推理，但全局图的构建、维护和在线排序成本极高，难以支持数据的持续增量更新。SAG 的“超边（Event 作为连接多个实体的单元）+ SQL 查询”设计，既保留了结构化关系推理能力，又避免了全局图的高昂维护：每个 chunk 可独立处理，新数据只需新增事件和实体，无需重建索引。

这意味着，Agent 系统在需要多步推理、长期记忆和动态知识更新的场景下，首次有了一种既能达到 SOTA 精度、又能在真实工业规模下稳定运行的检索底座方案。

对用户/开发者/创作者的影响

对于正在构建 AI Agent（如代码助手、自动化工作流、知识管理工具）的开发者，SAG 展示了将“关系推理”从外部图谱计算解耦出来、内化到检索层的可行路径。若这项技术被集成到开源框架或商业化产品中，开发者在实现 Agent 的长期记忆和多跳推理时，将不再被迫在高精度与高成本之间二选一，可以更灵活地控制基础设施成本和维护复杂度。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

对于依赖 RAG 的企业用户，若能采用类似 SAG 的方案，数据库增量更新的难度将显著降低，知识库可以随业务变化持续扩展而不必频繁重建。

值得关注的后续

1. 开源与生态进展：目前 SAG 的介绍论文和产品信息已公开，但 Zleap AI 尚未公布完整的开源代码或 API。若其开放给社区，可能迅速成为 RAG 领域的主流基线方案。

2. 竞品反应：HippoRAG 2 和 GraphRAG 的作者可能会针对 SAG 的“超边 + SQL”设计进行改进，行业可能会迎来一波“RAG 检索层结构化”的迭代竞赛。

3. 真实应用效果验证：5 亿条数据的秒级检索是在特定业务场景下实现的，是否能在更复杂、多实体歧义程度更高的场景（如法务、医疗证据链）中保持同等性能，需要更多第三方复现和落地报告。

来源：Readhub · AI

RAG 新 SOTA，还在 5 亿条数据上跑进秒级，只有它了

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

Momenta 港股 IPO 证监会备案通过，冲击「物理 AI 第一股」

大厂 AI 资产分拆进行时： 可灵为字节、阿里探路？

小米正式发布「全屋智能 AI 开源方案」Xiaomi Miloco 2.0

发表回复取消回复

大厂 AI 资产分拆进行时：可灵为字节、阿里探路？