Not Able to use Dedicatedd GPU

在 Windows 系统上使用 Ollama 运行模型时(例如 ollama run ministral-3:3b --verbose "test" ),发现在升级 Ollama 版本后,GPU 利用率显示为 Intel UHD Graphics(核显),而 NVIDIA RTX 4050、RTX

Not Able to use Dedicatedd GPU

Not Able to use Dedicatedd GPU

快速结论:此问题通常出现在 Ollama 升级到 0.30.x 之后,系统错误地将 NVIDIA 独立 GPU 识别为集成显卡(Integrated GPU)并加以忽略,转而使用 Intel 核显。优先尝试完全卸载后全新安装 Ollama。

问题场景

在 Windows 系统上使用 Ollama 运行模型时(例如 ollama run ministral-3:3b --verbose "test"),发现在升级 Ollama 版本后,GPU 利用率显示为 Intel UHD Graphics(核显),而 NVIDIA RTX 4050、RTX 2060 或 RTX 4070 等独立 GPU 未被使用,导致推理速度极慢。

报错原文

time=... source=runner.go:396 msg="dropping integrated GPU; to enable, set OLLAMA_IGPU_ENABLE=1" id=1 library=Vulkan compute=0.0 name=Vulkan1 description="NVIDIA GeForce RTX 2060" pci_id=""
time=... source=types.go:32 msg="inference compute" id=0 library=Vulkan name=Vulkan0 description="Intel(R) UHD Graphics P750" ... type=discrete total="31.8 GiB" ...

ollama serve 日志中,NVIDIA 独立 GPU 被描述为 Vulkan1 且被标记为 dropping integrated GPU,而核显被错误地标记为 type=discrete 并拥有 total="31.8 GiB"

原因分析

可能原因:Ollama 0.30.x 版本的 GPU 发现逻辑存在 Bug,导致通过 Vulkan 枚举 GPU 时,将 NVIDIA 独立 GPU 误判为集成显卡(integrated GPU)并自动排除,同时将 Intel 核显误认为独立显卡(discrete)并优先用于推理。该行为与 CUDA 后端无关,即使 CUDA 后端已正确识别 GPU(例如 library=CUDA compute=7.5 name=CUDA0 description="NVIDIA GeForce RTX 2060"),Vulkan 后端的错误分类仍可能导致调度器选择核显。

环境排查

  • Ollama 版本:请确认是否为 0.30.0 ~ 0.30.6 版本
  • 操作系统:Windows(该问题在 Windows 下被报告)
  • GPU:NVIDIA RTX 4050 / RTX 2060 / RTX 4070 + Intel 核显(UHD Graphics P750 / UHD Graphics)
  • 驱动:确认 NVIDIA 驱动已安装且 Vulkan 和 CUDA 运行时可用

解决步骤

  1. 完全卸载 Ollama:通过 Windows “添加或删除程序” 卸载。
  2. 删除遗留数据目录(可选但推荐):删除 %USERPROFILE%\.ollama 目录(注意:这将删除所有本地模型和数据,如有必要请先备份模型)。
  3. 从 Ollama 官方网站下载最新版本安装包并执行全新安装(不是覆盖安装,是卸载重启后重装)。
  4. 安装完成后启动 Ollama,运行 ollama run <model> 测试。

此方案由多位用户验证有效,可优先尝试。

验证方法

运行 ollama run <model> --verbose "test" 并观察输出中的 eval rate 数值。独立 GPU 使用时 eval rate 应在 90+ tokens/s(例如 RTX 2060 为 95.35 tokens/s),而核显通常低于 5 tokens/s(例如 Intel UHD P750 仅 2.00 tokens/s)。也可以运行 ollama serve 查看日志中 GPU 类型描述是否恢复到正确分类。

参考来源

ollama/ollama #16536

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

celebrityanime
celebrityanime
文章: 10969

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注