[Question]: Why does reranking need to recalculate the scores for vector search and full-text search?

快速结论：RAGFlow 的 rerank 阶段会重新计算分数，是为了融合向量搜索和全文搜索的多个相关性信号（语义相似度和关键词匹配），以提供更综合、更精确的排序。如果发现 reranking 降低了准确性，可以优先检查权重参数或自定义 rerank 逻辑。

问题场景

用户在使用 RAGFlow 进行检索增强生成（RAG）时，从数据库中通过向量搜索和全文搜索获取了一批数据后，观察到 rerank 阶段（在 Python 脚本中）重新计算了分数，而没有直接使用数据库原始分数。用户质疑这种重算行为可能破坏基于原始相关性的排序，从而降低查询准确性。

报错原文

After retrieving a batch of data from the database using vector search and full-text search, why does the rerank stage recalculate the scores in a Python script instead of directly using the scores computed by the database? This disrupts the original relevance-based ranking of documents, potentially lowering query accuracy.

原因分析

RAGFlow 的 reranking 阶段之所以需要重新计算分数，是因为它采用了混合评分机制。该机制综合了多个相关性信号——特别是向量相似度（语义匹配）和关键词/标记相似度（词汇匹配）。数据库的初始分数（无论是来自向量搜索还是全文搜索）仅基于各自单独的算法，可能无法完全满足特定用例对综合相关性的需求。

Reranking 阶段使用 Python 实现的加权组合方式来重新评分，允许根据额外标准（如某些关键词的重要性，或查询与文档内容之间的语义相似度）调整排序，这些因素在初始数据库评分中可能未被考虑。此外，分数也会被归一化，以确保不同检索方法（向量和关键词搜索）的分数在合并到单个排序列表时具有一致性。这种混合方法是 RAGFlow 在没有自定义 rerank 模型时的默认行为，旨在通过利用比单一搜索方法更多的信息来提升最终结果的相关性。

虽然这一过程可能会打乱数据库的原始排序，但其目的是提供更细致、更准确的排序。如果发现 reranking 降低了准确性，可能原因是权重参数不适合您的用例，或者需要自定义 rerank 逻辑。

环境排查

确认 RAGFlow 版本。
确认是否设置了自定义的 rerank 模型。如果没有设置，则使用默认的混合评分机制。
检查 rag/nlp/search.py 和 rag/llm/rerank_model.py 中的评分逻辑和权重参数。

解决步骤

理解默认行为：RAGFlow 在无自定义 rerank 模型时，默认使用 Python 脚本中的混合评分机制，它将向量相似度和关键词相似度加权结合，并对分数进行归一化处理。
审查权重参数：如果默认行为不符合预期，可优先尝试审查并调整 rag/nlp/search.py 中的权重参数，以改变向量搜索和全文搜索在最终排序中的影响比例。
自定义 rerank 逻辑：如果调整权重仍不能解决问题，可以实施自定义的 rerank 模型或逻辑。参考 RAGFlow 的 rerank 模型接口 rag/llm/rerank_model.py，编写符合您特定评分标准的 rerank 处理函数。
直接使用数据库分数：如果您的用例更依赖于数据库原始的相关性排序，并且不希望进行混合重排序，您可以绕过默认的 rerank 阶段，直接使用数据库返回的原始分数。但这需要修改 RAGFlow 的检索流程，可能会牺牲语义与词汇匹配的综合优势。

验证方法

修改权重参数或自定义 rerank 逻辑后，在相同的测试查询集上对比 rerank 前后的结果。观察检索结果的排序是否更符合您的准确性预期，并确认查询准确率（如 MRR、NDCG 等指标）是否得到提升。

参考来源

infiniflow/ragflow #7784

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

[Question]: Why does reranking need to recalculate the scores for vector search and full-text search?