RAG 新 SOTA，还在 5 亿条数据上跑进秒级，只有它了

一句话看懂：广州智跃深空人工智能科技有限公司（Zleap AI）提出了一种名为 SAG（SQL-Retrieval Augmented Generation）的新检索增强生成方案，在多跳问答任务上超越 HippoRAG 2 成为新 SOTA，并在 5 亿条数据的生产环境中实现了秒级检索延迟。它用“事件+实体”的数据库结构替代了传统知识图谱，解决了 RAG 在 Agent 时代的多步推理与规模化落地难题。

事件核心：发生了什么

6 月 18 日，Zleap AI 发布了对 SAG 的详细介绍。SAG 的核心思路是：离线阶段，将原始文本拆解为“事件（Event）”和“实体（Entity）”并存入 SQL 与向量索引中；在线查询时，用 SQL join 和向量检索分别找到相关的实体与事件，再通过共享实体将分散的事件临时串联成推理链。

在三个多跳问答数据集（HotpotQA、2WikiMultiHopQA、MuSiQue）上，SAG 的平均 Recall@2 为 79.3%，Recall@5 为 88.2%，领先 HippoRAG 2 约 11 个百分点。在推理难度最高的 MuSiQue 上，SAG 的 Recall@5（80.0%）比 HippoRAG 2（65.1%）高出近 15 个百分点。更重要的是，该方案已在约 5 亿条数据规模的生产环境中部署，检索延迟保持在秒级。

为什么重要

传统 RAG 在 Agent 应用中存在致命缺陷：仅基于向量相似度检索，容易在一步推理中选错材料，导致后续推理链持续跑偏。GraphRAG 通过预建知识图谱改善了关系推理，但全局图的构建、维护和在线排序成本极高，难以支持数据的持续增量更新。SAG 的“超边（Event 作为连接多个实体的单元）+ SQL 查询”设计，既保留了结构化关系推理能力，又避免了全局图的高昂维护：每个 chunk 可独立处理，新数据只需新增事件和实体，无需重建索引。

这意味着，Agent 系统在需要多步推理、长期记忆和动态知识更新的场景下，首次有了一种既能达到 SOTA 精度、又能在真实工业规模下稳定运行的检索底座方案。

对用户/开发者/创作者的影响

对于正在构建 AI Agent（如代码助手、自动化工作流、知识管理工具）的开发者，SAG 展示了将“关系推理”从外部图谱计算解耦出来、内化到检索层的可行路径。若这项技术被集成到开源框架或商业化产品中，开发者在实现 Agent 的长期记忆和多跳推理时，将不再被迫在高精度与高成本之间二选一，可以更灵活地控制基础设施成本和维护复杂度。