标签： ChatGPT

KV Cache 终于不用无脑全留了！百度 & 复旦用「投资回报率」重新分配缓存｜ICML 2026

百度百舸团队与复旦大学联合提出 LU-KV 框架，将 KV Cache（键值缓存）的预算分配建模为全局组合优化问题，在 80% 压缩率下仅造成 0.52% 的性能损失（基于 Qwen2.5-32B 在 LongBench 上的评测），相关工作已被 ICML 2026 接收。

Anthropic 于 2026 年 6 月 9 日发布的最强大模型 Fable 5，在 72 小时内先后遭遇破解和国家级出口管制。事件暴露了 AI 能力增长正超越人类控制能力的核心矛盾，并引发对“最安全公司”安全框架有效性的广泛质疑。

6月15日，深圳迅策科技（3317.HK）宣布与沐曦股份、天数智芯、壁仞科技三家国产GPU厂商签署战略合作协议，系统性将自身的场景化数据与TokenOS操作系统深度绑定国产算力，旨在为客户提供从芯片到数据治理的“开箱即用”一体化方案，解决企业AI部署中算力供应的国产化替代与效率难题。

研究人员通过知识蒸馏技术，将九个不同医学领域的CLIP模型（专门处理病理、X光等）的知识融合进一个“学生”模型MMKD-CLIP，使得这个单一模型在26种医学影像模态下均表现出色，解决了现有模型“术业有专攻”但跨领域泛化能力差的问题。

纽约州等多州总检察长在OpenAI秘密递交IPO招股书后，联合向其发出传票，调查范围覆盖广告营销、用户留存、数据处理、未成年人保护，甚至包括模型的“谄媚”输出行为。这是AI行业首次被系统性地纳入消费者保护与产品安全执法框架，监管之手正式伸向模型说话的内容本身。

据外媒报道，字节跳动正在与国产 GPU 公司天数智芯谈判采购至少 5 万颗用于 AI 推理任务的芯片，同时也在考虑采购百度昆仑芯，以降低对单一海外芯片供应商的依赖。这一动向表明大型互联网公司正在加速国产 AI 芯片在推理场景的规模部署。

昆仑万维Skywork团队在智源大会上公布了其世界模型Matrix-Game 3.5的技术突破，核心是将“状态预测”与“动作生成”进行联合训练，并计划于2026年7月正式发布。这一思路可能改变当前世界模型仅关注“预测下一帧”的研发方向。

Anthropic 刚发布的最强模型 Claude Fable5 和 Claude Mythos5，上线仅三天就被美国政府以国家安全为由，禁止外国国民访问（含公司内部外籍员工）。Anthropic 被迫临时下架两个模型，IPO 关键牌被按下暂停键。

巴西里约热内卢市政府旗下IT公司IplanRIO开源的Rio 3.5 397B模型，在多项基准测试中超越Qwen 3.7 Plus等开源模型，成为开源社区新的SOTA（最佳状态模型），引发全球AI圈关注。

华为、绿联、小米等消费电子品牌接连入局NAS（网络附加存储）领域，同时摩尔线程、群晖等厂商开始为NAS加入独立AI算力，试图将这一小众品类升级为家庭数据中枢和本地AI助理。关键问题是：AI能否让NAS摆脱“冷板凳”身份，成为下一代家庭智能硬件入口。