标签: AI应用

Memory Leak investigation

Memory Leak investigation

用户在使用 Faster Whisper(模型为 small,设备为 CUDA)进行批量音频转写时,以循环方式反复调用 model.transcribe() ,每次处理约 4.5 MB 的 9 分钟音频文件。持续数小时后,系统内存(RAM)被占满,SageMaker 或 EC2 实例上的 Worke

Float16 issue

Float16 issue

用户运行 Faster Whisper Python 脚本(使用 WhisperModel 加载 small 模型并调用 transcribe )时,在控制台看到一条 ctranslate2 发出的警告信息。部分用户可能会误以为这是 ValueError 错误,但实际上它只是一个运行时警告。