Error: model runner has unexpectedly stopped, this may be due to resource limitations or an internal error, check ollama server logs for det

用户在 Windows 11 和 Arch Linux 上运行 Ollama 时,使用 AMD Radeon 780M (Ryzen 7 PRO 8845HS)、7800XT、6650XT、6800XT、7900 XTX 以及 NVIDIA 5060 Ti 等多种 GPU 时,均触发了该错误。问题在

Error: model runner has unexpectedly stopped, this may be due to resource limitations or an internal error, check ollama server logs for det

Error: model runner has unexpectedly stopped, this may be due to resource limitations or an internal error, check ollama server logs for det

快速结论:此报错在 Ollama 加载或运行模型时出现,优先排查 GPU 驱动和 ROCm 版本匹配性。对于 AMD 显卡用户,该问题通常由不兼容的 ROCm 库版本导致。

问题场景

用户在 Windows 11 和 Arch Linux 上运行 Ollama 时,使用 AMD Radeon 780M (Ryzen 7 PRO 8845HS)、7800XT、6650XT、6800XT、7900 XTX 以及 NVIDIA 5060 Ti 等多种 GPU 时,均触发了该错误。问题在 Ollama 0.9.6 至 0.18.2 版本中均有出现。

报错原文

Error: model runner has unexpectedly stopped, this may be due to resource limitations or an internal error, check ollama server logs for details

服务器日志典型片段(部分):

time=2025-07-15T09:31:27.217+08:00 level=WARN source=amd_windows.go:138 msg="amdgpu is not supported (supported types:[gfx1030 gfx1100 gfx1101 gfx1102 gfx1151 gfx906])" gpu_type=gfx1103 gpu=0 library=C:\Users\tts2\AppData\Local\Programs\Ollama\lib\ollama\rocm

对于 NVIDIA 显卡,日志中可能出现:

error looking up nvidia GPU memory" error="cuda driver library failed to get device context 801

原因分析

主要原因是 ROCm 库版本不兼容。多位用户报告在从 ROCm 6.4.1 升级到 6.4.3-2 后出现问题,而回退到 6.4.1 修复了该问题。低概率原因包括:
– GPU 驱动版本过旧或不匹配(主要是 AMD 用户,也有 NVIDIA 5060 Ti 用户报告类似问题)。
– Ollama 特定版本与 ROCm 库组合出现 bug(有用户通过降级到 v0.11.6 绕过问题,即便使用了较新的 ROCm 库)。
– GPU 架构不显式在支持列表(如 Radeon 780M 的 gfx1103 架构不在 Ollama 的 ROCm 支持类型之列)。

环境排查

  • GPU 驱动版本:核查 AMD RADV/Vulkan 驱动版本(尤其是 Windows)或 NVIDIA CUDA 驱动版本。
  • ROCm 库版本:确认系统安装的 ROCm 版本(适用于 Linux 用户)。
  • Ollama 版本:检查当前 Ollama 版本(可通过 ollama --version 确认),关注是否为 0.9.6 或高于 0.18.x。
  • 操作系统:Win11 24H2 / 23H2 和 Arch Linux 等均可能受影响。
  • GPU 架构:在日志中查找 gpu_type= 字段,确认 GPU 架构是否属于 Ollama 默认支持的 ROCm 类型。

解决步骤

  1. (Linux 用户优先尝试)降级 ROCm 库
    将所有 ROCm 包回退到版本 6.4.1。例如在 Arch Linux 上执行类似 downgrade rocm-* 6.4.1-2 的命令(具体操作取决于包管理器)。
  2. 升级 GPU 驱动
    对于 AMD 用户,更新到最新的 AMD GPU 驱动程序(如 2025 年 7 月 24 日发布的版本)。对于 NVIDIA 用户,更新 CUDA 驱动程序至较新版本。
  3. 降级 Ollama 版本(可尝试)
    如果步骤 1、2 无效,可将 Ollama 降级到 v0.11.6 或更早版本,然后检查是否恢复。
  4. 确认 GPU 兼容性
    在日志中找到 GPU 类型(如 gpu_type=gfx1103),对照 Ollama 官方支持的 AMD GPU 架构列表。如果不支持,可能需要等待更新或改用 CPU 模式。——这是已知的限制,无直接解决方案。
  5. (NVIDIA 用户)检查 CUDA 上下文
    如果日志出现 cuda driver library failed to get device context 801,重装或更新 NVIDIA 驱动。
  6. 开启调试日志
    设置 OLLAMA_DEBUG=1 环境变量后再启动 Ollama 服务,获取详细日志以便进一步排查。

验证方法

执行 ollama run <模型名>,观察是否仍出现“model runner has unexpectedly stopped”错误,并检查服务器日志不再出现 amdgpu is not supported 或 CUDA 设备上下文错误。

参考来源

ollama/ollama #11421

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

celebrityanime
celebrityanime
文章: 11163

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注