![[Bug]: "qllama/bge-reranker-v2-m3:latest" cannot be recognized as a reranker model.](https://www.chat-gpts.plus/wp-content/uploads/2026/06/16115-2e5d8cf8.jpg)
[Bug]: “qllama/bge-reranker-v2-m3:latest” cannot be recognized as a reranker model.
快速结论:该报错发生在 RAGFlow 中通过 Ollama 提供商添加 reranker 模型时,RAGFlow 的自动检测逻辑无法识别 Ollama 模型的 reranker 类型。优先排查是否可以通过手动 API 注册绕过自动检测。
问题场景
用户在 RAGFlow v0.26.0(对应 workspace commit ID 6865039a2)中,通过 Ollama 提供商添加从 Ollama 拉取的 qllama/bge-reranker-v2-m3:latest 模型。RAGFlow 运行在 CPU-only 模式下,但问题同样可能出现在 GPU 环境。在步骤中,用户点击“List Models”选择该模型后,RAGFlow 将其识别为聊天模型(chat model),而非 reranker。
报错原文
RAGFlow recognized it as a chat model, not a reranker model.
(注意:这是一个行为描述,并非字面错误日志,用户界面上模型类型被错误归类为 chat。)
原因分析
这是 RAGFlow 代码中的一个已知限制。RAGFlow 通过查询 Ollama 的 /api/show 接口来获取模型能力,并将返回的能力映射到内部模型类型,但该映射只覆盖了 completion → chat、embedding → embedding 和 vision → image2text,没有 “rerank” 能力映射。此外,RAGFlow 代码库中也不存在 OllamaRerank 类实现。
相比之下,RAGFlow 的 OpenAI-API-Compatible 提供商通过模型名称关键字(如 “rerank”/”reranker”)进行检测,但此逻辑并未应用于 Ollama 提供商。
环境排查
- RAGFlow 版本:v0.26.0(及可能存在相同问题的其他版本)
- 确认 RAGFlow 运行模式:CPU-only 或 GPU 模式
- 确认 Ollama 服务是否正常运行,且可通过
http://host.docker.internal:11434(或其他地址)访问 - 确认模型
qllama/bge-reranker-v2-m3:latest已通过ollama pull成功拉取 - 可尝试通过
curl http://localhost:11434/api/show手动验证模型是否为 reranker
解决步骤
- 推荐工作区:手动注册模型
使用 RAGFlow 的 API (
POST /v1/llm/add_llm)将模型手动注册为 reranker,绕过自动检测:POST /v1/llm/add_llm { "llm_factory": "Ollama", "llm_name": "qllama/bge-reranker-v2-m3:latest", "model_type": "rerank", "api_key": "", "api_base": "http://host.docker.internal:11434" }这将强制模型类型为 “rerank”。注意:即使这样,由于没有
OllamaRerank类,运行时是否正常工作取决于 RAGFlow 如何分发 rerank 请求。 - 可优先尝试:检查 WebUI 是否存在类似选项
部分版本可能存在绕过自动检测的 UI 配置,但 Issue 中未提及。手动 API 是确认的解决方案。
- 替代方案:使用 OpenAI-API-Compatible 提供商
如果 Ollama 支持 OpenAI 兼容接口,可尝试通过
OpenAI-API-Compatible提供商添加,并确保模型名称包含 “rerank” 关键词。
验证方法
执行手动 API 注册后,回到 RAGFlow 设置页面,确认该模型出现在模型列表中且类型显示为 “rerank”。然后在一个需要 reranker 的工作流(如检索增强生成流程)中尝试使用此模型,观察是否能正常返回重排序结果。



