RAG 新 SOTA,还在 5 亿条数据上跑进秒级,只有它了

广州智跃深空人工智能科技有限公司(Zleap AI)提出了一种名为 SAG(SQL-Retrieval Augmented Generation)的新检索增强生成方案,在多跳问答任务上超越 HippoRAG 2 成为新 SOTA,并在 5 亿条数据的生产环境中实现了秒级检索延迟。它用“事件+实体”的数据库结构…

RAG 新 SOTA,还在 5 亿条数据上跑进秒级,只有它了

一句话看懂:广州智跃深空人工智能科技有限公司(Zleap AI)提出了一种名为 SAG(SQL-Retrieval Augmented Generation)的新检索增强生成方案,在多跳问答任务上超越 HippoRAG 2 成为新 SOTA,并在 5 亿条数据的生产环境中实现了秒级检索延迟。它用“事件+实体”的数据库结构替代了传统知识图谱,解决了 RAG 在 Agent 时代的多步推理与规模化落地难题。

事件核心:发生了什么

6 月 18 日,Zleap AI 发布了对 SAG 的详细介绍。SAG 的核心思路是:离线阶段,将原始文本拆解为“事件(Event)”和“实体(Entity)”并存入 SQL 与向量索引中;在线查询时,用 SQL join 和向量检索分别找到相关的实体与事件,再通过共享实体将分散的事件临时串联成推理链。

在三个多跳问答数据集(HotpotQA、2WikiMultiHopQA、MuSiQue)上,SAG 的平均 Recall@2 为 79.3%,Recall@5 为 88.2%,领先 HippoRAG 2 约 11 个百分点。在推理难度最高的 MuSiQue 上,SAG 的 Recall@5(80.0%)比 HippoRAG 2(65.1%)高出近 15 个百分点。更重要的是,该方案已在约 5 亿条数据规模的生产环境中部署,检索延迟保持在秒级。

为什么重要

传统 RAG 在 Agent 应用中存在致命缺陷:仅基于向量相似度检索,容易在一步推理中选错材料,导致后续推理链持续跑偏。GraphRAG 通过预建知识图谱改善了关系推理,但全局图的构建、维护和在线排序成本极高,难以支持数据的持续增量更新。SAG 的“超边(Event 作为连接多个实体的单元)+ SQL 查询”设计,既保留了结构化关系推理能力,又避免了全局图的高昂维护:每个 chunk 可独立处理,新数据只需新增事件和实体,无需重建索引。

这意味着,Agent 系统在需要多步推理、长期记忆和动态知识更新的场景下,首次有了一种既能达到 SOTA 精度、又能在真实工业规模下稳定运行的检索底座方案。

对用户/开发者/创作者的影响

对于正在构建 AI Agent(如代码助手、自动化工作流、知识管理工具)的开发者,SAG 展示了将“关系推理”从外部图谱计算解耦出来、内化到检索层的可行路径。若这项技术被集成到开源框架或商业化产品中,开发者在实现 Agent 的长期记忆和多跳推理时,将不再被迫在高精度与高成本之间二选一,可以更灵活地控制基础设施成本和维护复杂度。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

对于依赖 RAG 的企业用户,若能采用类似 SAG 的方案,数据库增量更新的难度将显著降低,知识库可以随业务变化持续扩展而不必频繁重建。

值得关注的后续

1. 开源与生态进展:目前 SAG 的介绍论文和产品信息已公开,但 Zleap AI 尚未公布完整的开源代码或 API。若其开放给社区,可能迅速成为 RAG 领域的主流基线方案。

2. 竞品反应:HippoRAG 2 和 GraphRAG 的作者可能会针对 SAG 的“超边 + SQL”设计进行改进,行业可能会迎来一波“RAG 检索层结构化”的迭代竞赛。

3. 真实应用效果验证:5 亿条数据的秒级检索是在特定业务场景下实现的,是否能在更复杂、多实体歧义程度更高的场景(如法务、医疗证据链)中保持同等性能,需要更多第三方复现和落地报告。

来源:Readhub · AI

celebrityanime
celebrityanime
文章: 8526

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注