标签： AI

AI 资讯

Memory Leak investigation

用户在使用 Faster Whisper（模型为 small，设备为 CUDA）进行批量音频转写时，以循环方式反复调用 model.transcribe() ，每次处理约 4.5 MB 的 9 分钟音频文件。持续数小时后，系统内存（RAM）被占满，SageMaker 或 EC2 实例上的 Worke

celebrityanime
2026年 6月 15日

AI 资讯

Float16 issue

用户运行 Faster Whisper Python 脚本（使用 WhisperModel 加载 small 模型并调用 transcribe ）时，在控制台看到一条 ctranslate2 发出的警告信息。部分用户可能会误以为这是 ValueError 错误，但实际上它只是一个运行时警告。

celebrityanime
2026年 6月 15日

AI 资讯

外媒：字节跳动洽谈为 AI 推理采购天数智芯、百度芯片

据外媒报道，字节跳动正在与国产 GPU 公司天数智芯谈判采购至少 5 万颗用于 AI 推理任务的芯片，同时也在考虑采购百度昆仑芯，以降低对单一海外芯片供应商的依赖。这一动向表明大型互联网公司正在加速国产 AI 芯片在推理场景的规模部署。

celebrityanime
2026年 6月 15日

AI 资讯

智源大会 | 天工AI重新定义世界模型，公布Matrix-Game 3.5 最新技术突破

昆仑万维Skywork团队在智源大会上公布了其世界模型Matrix-Game 3.5的技术突破，核心是将“状态预测”与“动作生成”进行联合训练，并计划于2026年7月正式发布。这一思路可能改变当前世界模型仅关注“预测下一帧”的研发方向。

celebrityanime
2026年 6月 15日

AI 资讯

最强Claude，卡在上市前夜

Anthropic 刚发布的最强模型 Claude Fable5 和 Claude Mythos5，上线仅三天就被美国政府以国家安全为由，禁止外国国民访问（含公司内部外籍员工）。Anthropic 被迫临时下架两个模型，IPO 关键牌被按下暂停键。

celebrityanime
2026年 6月 15日

AI 资讯

AI圈懵了：一家巴西市政IT公司开源的大模型，杀进了全球第一梯队

巴西里约热内卢市政府旗下IT公司IplanRIO开源的Rio 3.5 397B模型，在多项基准测试中超越Qwen 3.7 Plus等开源模型，成为开源社区新的SOTA（最佳状态模型），引发全球AI圈关注。

celebrityanime
2026年 6月 15日

AI 资讯

华为、绿联、小米都来了，AI NAS是真风口还是伪需求？

华为、绿联、小米等消费电子品牌接连入局NAS（网络附加存储）领域，同时摩尔线程、群晖等厂商开始为NAS加入独立AI算力，试图将这一小众品类升级为家庭数据中枢和本地AI助理。关键问题是：AI能否让NAS摆脱“冷板凳”身份，成为下一代家庭智能硬件入口。

celebrityanime
2026年 6月 15日

AI 资讯

在AWS上为百万企业级B2B平台构建安全的MCP服务器

InfoQ CN 报道了一个基于 100 万家企业档案的 B2B 情报平台如何通过 AWS 构建安全的 MCP（模型上下文协议）服务器，核心是将读写操作严格分离、工具契约精确化，而不是把 MCP 当作 API 的简单包装。这件事说明，MCP 从“Demo 阶段”走向真实生产环境时，安全与可审计性才是真正的工程…