[Local LLM] lama.cpp 目前有重大性能 bug: checkpoint 的巡回逻辑对于混合模型(比如 qwen3.6-27B)无效,从而导致大概率每次对话都要 prefill 全文,严重拖慢速度
![[Local LLM] lama.cpp 目前有重大性能 bug: checkpoint 的巡回逻辑对于混合模型(比如 qwen3.6-27B)无效,从而导致大概率每次对话都要 prefill 全文,严重拖慢速度](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_2-452-768x403.jpg)
开源推理引擎 llama.cpp 被曝出一个严重性能 Bug——其缓存恢复逻辑对 Qwen3.6-27B 这类混合架构模型失效,导致每次请求都需要重新处理完整对话历史,实测在 50K 上下文长度下每次请求会额外浪费约 40 秒,目前该问题仍未修复。
![[Local LLM] lama.cpp 目前有重大性能 bug: checkpoint 的巡回逻辑对于混合模型(比如 qwen3.6-27B)无效,从而导致大概率每次对话都要 prefill 全文,严重拖慢速度](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_2-452-768x403.jpg)
开源推理引擎 llama.cpp 被曝出一个严重性能 Bug——其缓存恢复逻辑对 Qwen3.6-27B 这类混合架构模型失效,导致每次请求都需要重新处理完整对话历史,实测在 50K 上下文长度下每次请求会额外浪费约 40 秒,目前该问题仍未修复。

西班牙 AI 机器人初创公司 Theker 完成 8500 万美元 A 轮融资,旨在打造可灵活重组形态的通用型工业机器人,而非当前流行的“人形机器人”路线。这笔被该公司称为“欧洲史上最大机器人 A 轮”的融资,由美国风投 CRV 领投,三星和 LVMH 关联基金 Aglaé Ventures 参投,标志着资本…

AI 编程工具的多会话协作模式正对本地硬件提出严峻考验——运行 5-10 个 Claude Code 会话、每个会话附带 1-3 个子代理,加上浏览器调试流程,这些日常开发场景已经让开发者开始抱怨电脑“越来越慢”。Hacker News 用户关于硬件升级和工具选择的讨论,折射出 AI 本地化应用进入“高性能需…

OpenAI 收购了专注于为 AI 智能体提供预配置云基础设施的初创公司 Ona,以此强化其编程助手 Codex 在生产环境下的安全部署与长周期执行能力。此举意味着 OpenAI 正加速将 Codex 从代码补全工具升级为能自主规划并执行生产任务的“数字工程师”。

大众点评于2026年6月12日宣布升级AIGC评价治理智能系统,通过技术手段识别并清除低质量AI生成评价,同时推出优质内容激励计划。这意味着平台正从“流量至上”转向“信任优先”,AI在商业场景中的滥用正被系统性地反制。

SK海力士计划在非核心技术领域引入ChatGPT、Microsoft 365 Copilot等外部生成式AI工具,正在从安全与系统架构层面评估企业级应用落地。这家全球半导体存储巨头正从“AI硬件供应商”向“深度AI使用者”转型,同时为平衡技术保护与效率提升提供行业参照。

Visa与OpenAI宣布战略合作,将Visa支付网络嵌入OpenAI平台,使ChatGPT等AI助手不仅能推荐商品,还能直接完成下单和支付。这项合作于2026年6月12日在Visa支付论坛上正式公布,标志着AI从“导购”升级为“AI代购”,购物流程可能因此发生根本性变化。

Meta在洛杉矶创作者活动上预览了其短视频编辑应用Edits的重大升级,即将推出基于Instagram数据深度分析的AI助手和桌面版。此举旨在直接对标字节跳动的CapCut(剪映海外版),并通过全平台覆盖和智能化创作功能,吸引更多创作者从第三方工具转移。

2026年6月11日,音乐流媒体平台Deezer正式上线一款免费AI音乐检测工具,能扫描Spotify、Apple Music等20个主流平台、27种语言的播放列表,帮助用户识别其中由AI生成的歌曲。这背后是平台上AI生成音乐占比已达44%、日均收到近7.5万首AI歌曲的行业现实,Deezer选择主动揭标并开…

美国即时配送巨头DoorDash于2026年6月11日正式推出名为“Ask DoorDash”的AI聊天机器人,用户可通过自然语言文本描述或直接发送照片来点餐和购买日杂。此举将外卖平台的交互模式从传统的列表搜索转向对话式多模态AI。