Float16 issue

用户运行 Faster Whisper Python 脚本(使用 WhisperModel 加载 small 模型并调用 transcribe )时,在控制台看到一条 ctranslate2 发出的警告信息。部分用户可能会误以为这是 ValueError 错误,但实际上它只是一个运行时警告。

Float16 issue

Float16 issue

快速结论:这个警告/报错在 Faster Whisper 使用 NVIDIA GPU 但显卡不支持 Tensor Cores 时出现。优先排查 GPU 型号是否支持 float16 张量核心,或直接在加载模型时指定 compute_typefloat32int8

问题场景

用户运行 Faster Whisper Python 脚本(使用 WhisperModel 加载 small 模型并调用 transcribe)时,在控制台看到一条 ctranslate2 发出的警告信息。部分用户可能会误以为这是 ValueError 错误,但实际上它只是一个运行时警告。

报错原文

[ctranslate2] [thread 28968] [warning] The compute type inferred from the saved model is float16, but the target device or backend do not support efficient float16 computation. The model weights have been automatically converted to use the float32 compute type instead.

原因分析

当 Faster Whisper 加载的模型权重(例如 small)默认使用 float16(半精度)存储时,ctranslate2 会检测 GPU 是否具备高效的 float16 计算能力(即是否拥有 Tensor Cores)。如果目标 GPU(如部分 Maxwell、Pascal 架构)没有 Tensor Cores,则不能高效执行 float16 运算,ctranslate2 会自动将权重转换为 float32 精度运行。

这本身不是一个错误,只是一个警告,提示用户计算精度被降级了。但对于某些用户,该警告可能被 Python 解释器当作 ValueError 捕获或显示为错误信息(取决于日志配置)。

环境排查

  • 确认 Python 版本(例如 3.8+)。
  • 确认 CUDA 版本(用户使用 CUDA 11.8)。
  • 确认 cuDNN 版本(用户使用 cuDNN 9)。
  • 确认显卡型号/架构是否支持 Tensor Cores(例如 GTX 10 系列及以上、RTX 系列支持;部分旧卡如 GTX 960 不支持)。
  • 确认 faster-whisperctranslate2 版本兼容性。

解决步骤

  1. 检查你的 GPU 是否支持高效的 float16 计算:
    • NVIDIA 显卡:GeForce GTX 10 系列以上、RTX 系列、Turing/Ampere/Hopper 架构拥有 Tensor Cores。
    • 使用 nvidia-smi -q | grep "CUDA Cap" 查看算力版本(算力 7.0+ 才支持 Tensor Cores)。
  2. 可优先尝试:在调用 transcribe 时显式指定 compute_type 参数为 float32,强制使用单精度计算,完全避免该警告:
    segments, info = model.transcribe(audio, compute_type="float32")
  3. 如果你的 GPU 支持 int8 量化,也可以尝试使用 compute_type="int8",理论上速度更快(注意可能影响识别准确率):
    segments, info = model.transcribe(audio, compute_type="int8")
  4. 如果上述步骤无效,且你仍想使用 float16 精度,可以考虑更换支持 Tensor Cores 的 GPU,或升级 ctranslate2 版本。

验证方法

重新运行原来的 Python 脚本,观察控制台是否仍输出相同的 [warning] 信息。如果使用 compute_type="float32""int8",该警告应消失,且 transcribe 功能正常执行并输出字幕结果。

参考来源

SYSTRAN/faster-whisper #727

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

celebrityanime
celebrityanime
文章: 7792

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注