Distributed speculative decoding: GPU draft model over network

用户在使用 llama.cpp 的 llama-server 或 llama-cli 进行分布式投机解码时,尝试通过 --spec-draft-model 指定远端 GPU 机器上的草稿模型(例如笔记本电脑上的 GPU 草稿模型,服务器上的 CPU 目标模型)。但现有参数要求草稿模型文件必须位于本地

用户在使用 llama.cpp 的 llama-server 或 llama-cli 进行分布式投机解码时,尝试通过 --spec-draft-model 指定远端 GPU 机器上的草稿模型(例如笔记本电脑上的 GPU 草稿模型,服务器上的 CPU 目标模型)。但现有参数要求草稿模型文件必须位于本地

OpenAI 于 2026 年 6 月 23 日宣布启动“Patch the Planet”计划,联合安全公司 Trail of Bits,利用其 AI 工具(如 Codex 安全系统)帮助开源项目识别和修复代码漏洞。此举意在将 AI 能力从“可能被滥用”扭转为“主动防御”,直接应对开源生态长期缺乏安全维护的…

OpenAI联合安全公司Trail of Bits发起“Patch the Planet”计划,利用AI安全工具配合人工审核,为开源项目排查并修复代码漏洞,旨在用主动防御的方式应对开源生态中长期存在的安全薄弱问题。

亚马逊已加入 OpenAI 广告系统,在 ChatGPT 对话中推送购物广告;但同时通过代码和法律手段,阻止包括 OpenAI 在内的 AI 系统抓取其产品数据。这种“双标”策略,本质是在拥抱AI带来的流量同时,严防核心数据外流。

智谱AI计划于今年8月正式发布新一代基础大模型GLM-5.5,据称参数规模或突破万亿。此前因美国对Anthropic两款顶尖模型实施访问限制,全球大模型竞争格局出现空隙,智谱正借此窗口加速追赶全球第一梯队。

谷歌DeepMind以7500万美元与独立电影公司A24达成战略合作,共同开发用于电影制作的AI工具。这不仅是好莱坞首次与头部AI实验室深度绑定研发创作工具,更意味着大模型技术在影视工业核心流程中进入实质落地的阶段。

凌川科技完成数亿元A+轮融资,其SL200芯片销量已接近10万颗。这家从快手内部孵化的AI芯片公司,正凭借自研的RISC-V架构和多模态大模型算力方案,试图打破英伟达在视频编码等细分领域的垄断。

SpaceX 与开源 AI 实验室 Reflection AI 签署了一份价值63亿美元、为期39个月的算力租赁协议,将其此前接手自 xAI 的“Colossus2”数据中心及英伟达GB300芯片资源开放给后者使用。此举标志着 SpaceX 正在加速变现其持有的 xAI 算力遗产,也让一家成立仅两年的开源模型…

Meta因一起内部数据安全事故,紧急叫停了名为“模型能力计划(MCI)”的AI训练项目。该项目通过记录员工键盘输入、鼠标轨迹等行为数据来训练AI,但近期因数据安全屏障崩溃,导致大量敏感信息泄露给全体员工,迫使Meta按下暂停键。此事再次暴露了AI大模型训练中数据边界与员工隐私保护的尖锐矛盾。

谷歌正在为其智能笔记应用 NotebookLM 秘密测试“文献综述”矩阵工具,可将大量文献自动组织成包含主题、论点、方法论的对比网格,标志着该产品从单篇摘要进入结构化知识分析阶段。