
issue: ollama does not work after update
快速结论:升级 Open WebUI 后,Ollama 接口虽然返回正常(/api/chat 收到 200),但 WebUI 聊天界面卡在“loading”状态,无法完成对话。优先排查 Open WebUI 版本是否存在 /api/chat/completions 后端回归,其次检查 Ollama 版本兼容性是否因新引擎引入问题。
问题场景
用户在 Docker 中运行 Open WebUI v0.9.6,Ollama 版本从 0.23.0-rc0(前一天正常工作)升级后,UI 一直显示“loading”,无法完成任何聊天请求。用户同时提到 Ollama 0.24.0 也存在类似行为(尝试 RAG embedding 模型时导致 worker 过载重启)。
多个评论者报告同一问题还出现在 Ollama v0.30.0、v0.30.6 和 Windows 环境下。
报错原文
# OWUI 日志 – 无明确错误,仅显示正常请求但 UI 卡住
GET /_app/immutable/nodes/3.Rf483QC1.js HTTP/1.1" 304
GET /_app/immutable/nodes/9.BU7GWhNy.js HTTP/1.1" 304
GET /ollama/api/version HTTP/1.1" 200
GET /api/version/updates HTTP/1.1" 200
GET /_app/version.json HTTP/1.1" 304
# 约10分钟后收到后端返回,但仍无法渲染
POST /api/chat/completions HTTP/1.1" 200
# Ollama 日志 – 看起来正常,没有 crash
source=server.go:1432 msg="llama runner started in 2.31 seconds"
172.17.0.1 | POST "/api/chat"
172.17.0.1 | POST "/api/chat"
172.17.0.1 | GET "/api/tags"
172.17.0.1 | GET "/api/ps"
172.17.0.1 | GET "/api/tags"
172.17.0.1 | GET "/api/ps"
172.17.0.1 | POST "/api/chat"
原因分析
根据 Issue 讨论及关联的多个已关闭 Issue,此问题可能由以下原因之一引起(部分为推测,尚未获得 Issue 作者最终确认):
- 可能原因:Open WebUI v0.9.5/v0.9.6 在 /api/chat/completions 端点上存在后端回归,导致流式响应处理异常,即使 Ollama 返回了完整响应(HTTP 200),UI 也无法正确渲染(关联 Issue #24553)。
- 可能原因:Ollama v0.30.0 引入了新的推理引擎,可能与旧版的 Open WebUI 存在兼容性问题,导致请求超时或 worker 进程过载(在 v0.24.0 上也有报告)。
- 可能原因:某些环境下,升级后残留的 Redis 任务数据导致特定对话线程卡死(关联 Issue #22525)。
环境排查
- Open WebUI 版本:v0.9.6(建议检查是否有更新版本,尤其是 dev 分支)
- Ollama 版本:v0.23.0-rc0(工作过)、v0.24.0(不工作)、v0.30.0(新引擎)、v0.30.6(Windows 报告)
- 安装方式:Docker
- 日志迹象:UI 收到 200 状态码但仍卡住,无 JavaScript 控制台错误
- 关联 PR:#25715(半相关)
解决步骤
- 降级 Ollama 版本(可优先尝试):将 Ollama 回退到之前工作的 v0.23.0-rc0 或稳定的 v0.22.x 版本,确认问题是否消失。如果消失,则问题出在 Ollama 新版本。
- 降级 Open WebUI 版本(可优先尝试):将 Open WebUI 降级至 v0.9.4 或更早版本(v0.8.12),测试聊天功能是否恢复正常。如果恢复,则说明当前 WebUI 版本存在后端回归。
- 清理浏览器缓存和 localStorage:完全清除浏览器缓存、IndexedDB 和 localStorage,重新登录 WebUI,排除本地状态损坏导致的 UI 卡住。
- 检查是否有卡住的对话任务:如果使用 Redis 或其他会话存储,尝试清除所有 stale(过期)的任务数据,然后重启容器。参考关联 Issue #22525。
- 尝试最新 dev 分支:Issue 维护者表示该问题“应该在最新的 dev 分支上修复了”,可拉取 dev 分支重建 Docker 镜像并测试。
- 确认网络/跨域设置:检查 OLLAMA_HOST 环境变量和 Open WebUI 的 OLLAMA_BASE_URL 是否配置正确(一般 Docker 内部应指向 ollama 容器名称或 172.17.0.1)。
验证方法
在降级或应用修复后,向模型发送一个简单对话消息(例如“Hello”),检查 UI 是否在几秒内显示回复,不再显示“loading”无限转圈。同时确认浏览器控制台未出现 4xx/5xx 错误以及 WebSocket 连接未断开。


![[Bug]: mmcv build failed with CUDA 12.8](https://www.chat-gpts.plus/wp-content/uploads/2026/06/4088-12e7b99e-768x403.jpg)
