[Local LLM] lama.cpp 目前有重大性能 bug: checkpoint 的巡回逻辑对于混合模型(比如 qwen3.6-27B)无效,从而导致大概率每次对话都要 prefill 全文,严重拖慢速度
![[Local LLM] lama.cpp 目前有重大性能 bug: checkpoint 的巡回逻辑对于混合模型(比如 qwen3.6-27B)无效,从而导致大概率每次对话都要 prefill 全文,严重拖慢速度](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_2-452-768x403.jpg)
开源推理引擎 llama.cpp 被曝出一个严重性能 Bug——其缓存恢复逻辑对 Qwen3.6-27B 这类混合架构模型失效,导致每次请求都需要重新处理完整对话历史,实测在 50K 上下文长度下每次请求会额外浪费约 40 秒,目前该问题仍未修复。
![[Local LLM] lama.cpp 目前有重大性能 bug: checkpoint 的巡回逻辑对于混合模型(比如 qwen3.6-27B)无效,从而导致大概率每次对话都要 prefill 全文,严重拖慢速度](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_2-452-768x403.jpg)
开源推理引擎 llama.cpp 被曝出一个严重性能 Bug——其缓存恢复逻辑对 Qwen3.6-27B 这类混合架构模型失效,导致每次请求都需要重新处理完整对话历史,实测在 50K 上下文长度下每次请求会额外浪费约 40 秒,目前该问题仍未修复。

韩美半导体宣布投资 500 亿韩元(约合 2.23 亿元人民币)购买 SpaceX 的股票和股权证券,交易预计于本月 16 日完成。这是一家半导体设备制造商直接押注航天和 AI 基础设施领域的领先企业,反映出产业资本对太空算力和卫星通信与 AI 结合趋势的强烈看好。

AI 编程工具的多会话协作模式正对本地硬件提出严峻考验——运行 5-10 个 Claude Code 会话、每个会话附带 1-3 个子代理,加上浏览器调试流程,这些日常开发场景已经让开发者开始抱怨电脑“越来越慢”。Hacker News 用户关于硬件升级和工具选择的讨论,折射出 AI 本地化应用进入“高性能需…

SK海力士计划在非核心技术领域引入ChatGPT、Microsoft 365 Copilot等外部生成式AI工具,正在从安全与系统架构层面评估企业级应用落地。这家全球半导体存储巨头正从“AI硬件供应商”向“深度AI使用者”转型,同时为平衡技术保护与效率提升提供行业参照。

6月12日早盘,港股人工智能板块集体上涨,智谱(02513.HK)、澜起科技、剑桥科技等公司股价涨幅显著,主要受海外科技股情绪回暖、尤其是美股存储和光通信板块上涨带动。

OpenAI CEO 萨姆·奥尔特曼将于6月14日访问韩国,计划与三星电子、Naver和Kakao等企业高管会面,重点讨论KakaoTalk整合ChatGPT服务的进一步商业合作,以及探索与三星等企业的新合作可能。这表明OpenAI正在加速亚洲市场布局,尤其是在移动端AI应用和硬件入口层面。

受AI算力需求爆发式增长驱动,锑、钨等战略性小金属价格持续走高,其中锑价年内涨幅已达40%左右。由于全球库存处于历史低位且供给弹性极低,本轮价格中枢可能长期高于过往周期,部分拥有相关资源的企业直接受益。

淡水泉投资董事总经理陶冬在公开视频中指出,当前 AI 大模型本身盈利困难,真正的商业价值集中在 AI 应用层面,并判断“AI + 制造业”将成为中国制造业未来 20 年竞争力的核心来源。这一观点将市场注意力从模型层拉向产业落地层。

电机控制器制造商格雷博向港交所提交招股书,暴露其严重依赖单一大客户吉利集团,而此前宣称布局的AI算力和机器人业务尚未产生任何收入,引发市场对其“AI概念”含金量的质疑。

一位开发者记录了自己从零开始训练一个340M参数规模的小型Llama基座模型的完整过程,包括步骤、挑战和成本。这件事之所以值得关注,是因为它展示了一个“轻量级”的大模型训练实验,让更多人直观了解现代LLM训练的实际门槛和资源消耗。