KV Cache 终于不用无脑全留了!百度 & 复旦用「投资回报率」重新分配缓存|ICML 2026

百度百舸团队与复旦大学联合提出 LU-KV 框架,将 KV Cache(键值缓存)的预算分配建模为全局组合优化问题,在 80% 压缩率下仅造成 0.52% 的性能损失(基于 Qwen2.5-32B 在 LongBench 上的评测),相关工作已被 ICML 2026 接收。

百度百舸团队与复旦大学联合提出 LU-KV 框架,将 KV Cache(键值缓存)的预算分配建模为全局组合优化问题,在 80% 压缩率下仅造成 0.52% 的性能损失(基于 Qwen2.5-32B 在 LongBench 上的评测),相关工作已被 ICML 2026 接收。

Anthropic 于 2026 年 6 月 9 日发布的最强大模型 Fable 5,在 72 小时内先后遭遇破解和国家级出口管制。事件暴露了 AI 能力增长正超越人类控制能力的核心矛盾,并引发对“最安全公司”安全框架有效性的广泛质疑。

6月15日,深圳迅策科技(3317.HK)宣布与沐曦股份、天数智芯、壁仞科技三家国产GPU厂商签署战略合作协议,系统性将自身的场景化数据与TokenOS操作系统深度绑定国产算力,旨在为客户提供从芯片到数据治理的“开箱即用”一体化方案,解决企业AI部署中算力供应的国产化替代与效率难题。

研究人员通过知识蒸馏技术,将九个不同医学领域的CLIP模型(专门处理病理、X光等)的知识融合进一个“学生”模型MMKD-CLIP,使得这个单一模型在26种医学影像模态下均表现出色,解决了现有模型“术业有专攻”但跨领域泛化能力差的问题。

纽约州等多州总检察长在OpenAI秘密递交IPO招股书后,联合向其发出传票,调查范围覆盖广告营销、用户留存、数据处理、未成年人保护,甚至包括模型的“谄媚”输出行为。这是AI行业首次被系统性地纳入消费者保护与产品安全执法框架,监管之手正式伸向模型说话的内容本身。

据外媒报道,字节跳动正在与国产 GPU 公司天数智芯谈判采购至少 5 万颗用于 AI 推理任务的芯片,同时也在考虑采购百度昆仑芯,以降低对单一海外芯片供应商的依赖。这一动向表明大型互联网公司正在加速国产 AI 芯片在推理场景的规模部署。

昆仑万维Skywork团队在智源大会上公布了其世界模型Matrix-Game 3.5的技术突破,核心是将“状态预测”与“动作生成”进行联合训练,并计划于2026年7月正式发布。这一思路可能改变当前世界模型仅关注“预测下一帧”的研发方向。

Anthropic 刚发布的最强模型 Claude Fable5 和 Claude Mythos5,上线仅三天就被美国政府以国家安全为由,禁止外国国民访问(含公司内部外籍员工)。Anthropic 被迫临时下架两个模型,IPO 关键牌被按下暂停键。

巴西里约热内卢市政府旗下IT公司IplanRIO开源的Rio 3.5 397B模型,在多项基准测试中超越Qwen 3.7 Plus等开源模型,成为开源社区新的SOTA(最佳状态模型),引发全球AI圈关注。

华为、绿联、小米等消费电子品牌接连入局NAS(网络附加存储)领域,同时摩尔线程、群晖等厂商开始为NAS加入独立AI算力,试图将这一小众品类升级为家庭数据中枢和本地AI助理。关键问题是:AI能否让NAS摆脱“冷板凳”身份,成为下一代家庭智能硬件入口。