
一句话看懂:广州智跃深空人工智能科技有限公司(Zleap AI)提出了一种名为 SAG(SQL-Retrieval Augmented Generation)的新检索增强生成方案,在多跳问答任务上超越 HippoRAG 2 成为新 SOTA,并在 5 亿条数据的生产环境中实现了秒级检索延迟。它用“事件+实体”的数据库结构替代了传统知识图谱,解决了 RAG 在 Agent 时代的多步推理与规模化落地难题。
事件核心:发生了什么
6 月 18 日,Zleap AI 发布了对 SAG 的详细介绍。SAG 的核心思路是:离线阶段,将原始文本拆解为“事件(Event)”和“实体(Entity)”并存入 SQL 与向量索引中;在线查询时,用 SQL join 和向量检索分别找到相关的实体与事件,再通过共享实体将分散的事件临时串联成推理链。
在三个多跳问答数据集(HotpotQA、2WikiMultiHopQA、MuSiQue)上,SAG 的平均 Recall@2 为 79.3%,Recall@5 为 88.2%,领先 HippoRAG 2 约 11 个百分点。在推理难度最高的 MuSiQue 上,SAG 的 Recall@5(80.0%)比 HippoRAG 2(65.1%)高出近 15 个百分点。更重要的是,该方案已在约 5 亿条数据规模的生产环境中部署,检索延迟保持在秒级。
为什么重要
传统 RAG 在 Agent 应用中存在致命缺陷:仅基于向量相似度检索,容易在一步推理中选错材料,导致后续推理链持续跑偏。GraphRAG 通过预建知识图谱改善了关系推理,但全局图的构建、维护和在线排序成本极高,难以支持数据的持续增量更新。SAG 的“超边(Event 作为连接多个实体的单元)+ SQL 查询”设计,既保留了结构化关系推理能力,又避免了全局图的高昂维护:每个 chunk 可独立处理,新数据只需新增事件和实体,无需重建索引。
这意味着,Agent 系统在需要多步推理、长期记忆和动态知识更新的场景下,首次有了一种既能达到 SOTA 精度、又能在真实工业规模下稳定运行的检索底座方案。
对用户/开发者/创作者的影响
对于正在构建 AI Agent(如代码助手、自动化工作流、知识管理工具)的开发者,SAG 展示了将“关系推理”从外部图谱计算解耦出来、内化到检索层的可行路径。若这项技术被集成到开源框架或商业化产品中,开发者在实现 Agent 的长期记忆和多跳推理时,将不再被迫在高精度与高成本之间二选一,可以更灵活地控制基础设施成本和维护复杂度。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
对于依赖 RAG 的企业用户,若能采用类似 SAG 的方案,数据库增量更新的难度将显著降低,知识库可以随业务变化持续扩展而不必频繁重建。
值得关注的后续
1. 开源与生态进展:目前 SAG 的介绍论文和产品信息已公开,但 Zleap AI 尚未公布完整的开源代码或 API。若其开放给社区,可能迅速成为 RAG 领域的主流基线方案。
2. 竞品反应:HippoRAG 2 和 GraphRAG 的作者可能会针对 SAG 的“超边 + SQL”设计进行改进,行业可能会迎来一波“RAG 检索层结构化”的迭代竞赛。
3. 真实应用效果验证:5 亿条数据的秒级检索是在特定业务场景下实现的,是否能在更复杂、多实体歧义程度更高的场景(如法务、医疗证据链)中保持同等性能,需要更多第三方复现和落地报告。
来源:Readhub · AI


