[BUG]: Meeting Assistant audio records at 2x speed after 30 seconds

用户使用 AnythingLLM 桌面版 v1.13.0(Windows 11)的 Meeting Assistant 功能录制会议音频(Teams、Zoom 等平台均受影响)。录音前 30 秒正常(实时速度、清晰),30 秒后音频以 2 倍速写入 WAV 文件,且伴有噪声。手动触发或自动触发录制均

[BUG]: Meeting Assistant audio records at 2x speed after 30 seconds

[BUG]: Meeting Assistant audio records at 2x speed after 30 seconds

快速结论:此问题出现在 AnythingLLM 桌面版会议助手中,录音在持续 30 秒后自动变为 2 倍速播放(录制),导致 1 小时会议仅生成 30 分钟音频文件。优先排查是否为 PCM 数据写入逻辑或音频帧叠加(frame overlay)导致,建议升级到 v1.14.0 以上版本。

问题场景

用户使用 AnythingLLM 桌面版 v1.13.0(Windows 11)的 Meeting Assistant 功能录制会议音频(Teams、Zoom 等平台均受影响)。录音前 30 秒正常(实时速度、清晰),30 秒后音频以 2 倍速写入 WAV 文件,且伴有噪声。手动触发或自动触发录制均复现此问题。用户已关闭可能的输入流干扰(Dolby 处理、Windows 通信设置、独占模式)。

报错原文

The meeting assistant recorded WAV file invariably starts normally for 30 seconds - audio is clear and in real-time speed. After 30 seconds, the audio is written at 2x speed, so a 1-hour meeting ends up being an audio file of 30 minutes.

原因分析

根据 Issue 讨论,此问题很可能与 PCM 数据写入方式有关。AnythingLLM 需要手动处理 PCM 数据写入 WAV 文件,在持续录制超过 30 秒后,某些音频帧可能存在叠加(frame overlay)或通道处理错误,导致时间戳/采样率被加速。开发者确认此问题将在 v1.14.0 以上版本修复,改进在于“保持通道分离”。可能原因包括:

  • PCM 数据写入逻辑中帧计数或时间戳溢出/重置,导致采样率被误加倍。
  • 音频帧叠加(frame overlay)导致通道数据混淆,使播放/录制速度翻倍。
  • 不排除系统级音频重采样或独占模式冲突(但用户已排除常见干扰项)。

注意:Issue 中开发者提到录音加速(非 2 倍速)在某些场景下被作为减少转录时间的“技巧”,但本问题中音频在 30 秒后强制变为 2 倍速且引入噪声,属于异常行为。

环境排查

  • AnythingLLM 桌面版版本:v1.13.0 及之前版本受影响(自 Meeting Assistant 初始发布即有)。
  • 操作系统:Windows 11(可能其他系统也受影响,Issue 未明确)。
  • 依赖项:确保无第三方音频处理软件(如 Dolby、Realtek 音频管理器、Voicemeeter 等)实时修改音频流。
  • 音频输出设备:确认扬声器/麦克风采样率设置为 44100 Hz 或 48000 Hz(避免系统重采样)。
  • 转录模型:Issue 中用户使用 Parakeet 0.6B(CPU),但此问题与转录模型无关,属于录制端 Bug。

解决步骤

  1. 升级 AnythingLLM 到 v1.14.0 或更高版本:开发者确认修复已包含在后续版本中(>1.14.0)。请前往 GitHub Releases 下载最新桌面版。
  2. 如无法升级,可尝试以下临时方案(未验证):
    • 将会议录制分段控制在 30 秒以内(例如手动停止再重新开始录制),避免触发加速逻辑。
    • 在 Windows 声音设置中:关闭“允许应用程序独占控制此设备”,并将默认格式设为 16 位 48000 Hz(CD 品质)。
    • 禁用任何第三方音频增强(如 Dolby、DTS、Nahimic)。
  3. 检查音频文件完整性:对已有 2 倍速录音文件,可使用音频软件(如 Audacity)降低播放速度 50% 以恢复正常时长和音调,但这并不解决录制问题。
  4. 反馈到 Issue:如果升级后问题依旧,请在该 Issue 评论区补充详细的系统日志(desktop app logs)和测试录音(可选),以便进一步排查。

验证方法

录制一次超过 60 秒的会议音频(手动触发或 Teams/Zoom 自动触发),然后播放生成的 WAV 文件。如果前 30 秒正常,30 秒后音频仍保持实时速度(无加速、无噪声),则问题已解决。也可以检查文件长度是否与实际会议时长一致(例如 10 分钟会议生成约 10 分钟音频)。此外,截图版本号验证已升级到 v1.14.0 以上。

参考来源

Mintplex-Labs/anything-llm #5782: [BUG]: Meeting Assistant audio records at 2x speed after 30 seconds

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

celebrityanime
celebrityanime
文章: 7657

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注