标签: AI

Memory Leak investigation

Memory Leak investigation

用户在使用 Faster Whisper(模型为 small,设备为 CUDA)进行批量音频转写时,以循环方式反复调用 model.transcribe() ,每次处理约 4.5 MB 的 9 分钟音频文件。持续数小时后,系统内存(RAM)被占满,SageMaker 或 EC2 实例上的 Worke

Float16 issue

Float16 issue

用户运行 Faster Whisper Python 脚本(使用 WhisperModel 加载 small 模型并调用 transcribe )时,在控制台看到一条 ctranslate2 发出的警告信息。部分用户可能会误以为这是 ValueError 错误,但实际上它只是一个运行时警告。

最强Claude,卡在上市前夜

最强Claude,卡在上市前夜

Anthropic 刚发布的最强模型 Claude Fable5 和 Claude Mythos5,上线仅三天就被美国政府以国家安全为由,禁止外国国民访问(含公司内部外籍员工)。Anthropic 被迫临时下架两个模型,IPO 关键牌被按下暂停键。

在AWS上为百万企业级B2B平台构建安全的MCP服务器

在AWS上为百万企业级B2B平台构建安全的MCP服务器

InfoQ CN 报道了一个基于 100 万家企业档案的 B2B 情报平台如何通过 AWS 构建安全的 MCP(模型上下文协议)服务器,核心是将读写操作严格分离、工具契约精确化,而不是把 MCP 当作 API 的简单包装。这件事说明,MCP 从“Demo 阶段”走向真实生产环境时,安全与可审计性才是真正的工程…