下一代投机解码:DFlash 与 Spec V2

Z Lab、SGLang 和 Modal 团队联合发布了 DFlash 投机解码方案与 Spec V2 推理引擎。在使用 Qwen 3.5 397B-A17B 模型时,DFlash 在单并发下实现了超过 4.3 倍的推理吞吐提升,标志着基于扩散模型的并行草稿生成首次在大型语言模型推理中取得实际落地效果。

Z Lab、SGLang 和 Modal 团队联合发布了 DFlash 投机解码方案与 Spec V2 推理引擎。在使用 Qwen 3.5 397B-A17B 模型时,DFlash 在单并发下实现了超过 4.3 倍的推理吞吐提升,标志着基于扩散模型的并行草稿生成首次在大型语言模型推理中取得实际落地效果。

Anthropic 在 2025 年 6 月 9 日发布旗舰模型 Claude Fable 5,却规定订阅用户仅能在 14 天内免费使用,之后需按 API 价格单独购买用量积分。这一决定并非孤立事件——过去八周内,OpenAI、GitHub 和 Anthropic 纷纷将 AI 产品从固定月费制转向按 tok…

Anthropic 在 2025年6月9日发布其史上最强模型 Fable 5(属于此前仅对安全机构开放的Mythos级别),但因用户对严苛安全护栏的不满、安全研究者的绕开攻击指控、以及美国商务部以出口管制为由要求暂停外国公民访问,最终在6月12日被全面下线。从发布到关闭仅四天,暴露了 AI 前沿模型治理的系统…

美国联邦法官驳回了马斯克旗下 xAI 对 OpenAI 的商业机密窃取指控,原因是证据不足。这起诉讼是两家 AI 公司之间法律纠纷的最新进展,反映了 AI 行业人才争夺与商业机密保护的复杂性。

“崩老头”这种以提供情绪价值为名、索要小额钱财的灰色产业链,在 AI 时代不仅未被取代,反而借助 AI 工具提升运营效率、扩大规模;其月入数万元的能力,揭示了 AI 在“真实情绪连接”场景下的核心短板——用户付费意愿的底层逻辑在于主观感知的真人倾听,而非 AI 的客观功能。

脱口秀演员傅首尔在综艺节目《心真大俱乐部》中公开了自己曾因创作压力和外界评价陷入深度情绪低谷,甚至三天未下床的经历,并与演员思文交流后泪洒现场。这一事件登上热搜,反映了创作者群体普遍面临的精神内耗和公众对心理健康议题的关注,也侧面印证了AI辅助创作工具在缓解内容从业者焦虑上的潜在需求。

6月5日美股经历“黑色星期五”,纳斯达克指数单日暴跌4.18%,英伟达、博通、台积电等AI核心股遭遇重挫,费城半导体指数下跌10.3%,创2020年3月以来最大跌幅。市场正在质疑:AI狂热是否已积累成即将破裂的泡沫?

AIDE 研究院对 16.1 万条标普 500 企业的招聘数据分析显示,71% 的 AI 相关岗位为高级岗,仅 13% 留给初级求职者。这一结构性失衡表明,AI 就业红利主要流向资深从业者,而非零基础新人。

英伟达宣布通过发行债券筹集至少 200 亿美元,这是其自 2021 年以来首次重返债券市场。此举并非因为缺钱,而是反映了 AI 基础设施投资规模已达到空前水平——即便是行业最大受益者,也需要借助资本市场为这场“算力军备竞赛”储备资金。

一位创业导师在杭州连续评审20场真实企业答辩后,发现虽AI渗透率达100%,但项目质量堪忧——AI被普遍用作“思考止痛药”而非“商业手术刀”,暴露出企业诊断失准、战略悬浮、协作失能等深层问题。