GPT-5.5 产生的幻觉是 MIT 许可的 GLM-5.2 的 3 倍

一份最新独立测试显示,参数规模高达万亿级别的 GPT-5.5 在回答未知问题时编造答案的比例(86%)是仅 753B 参数的开源模型 GLM-5.2(28%)的三倍。这直接挑战了“模型越大越智能”的主流认知,并暴露了当前大模型在常识边界判断上的结构性缺陷。

一份最新独立测试显示,参数规模高达万亿级别的 GPT-5.5 在回答未知问题时编造答案的比例(86%)是仅 753B 参数的开源模型 GLM-5.2(28%)的三倍。这直接挑战了“模型越大越智能”的主流认知,并暴露了当前大模型在常识边界判断上的结构性缺陷。

Arch Linux 的社区软件仓库 AUR 遭到持续性攻击,攻击者通过注册新账户接管大量无人维护的软件包并植入恶意代码,迫使项目方暂时关闭新用户注册,暴露了 AUR 协作模式在安全审查方面的根本性缺陷。

两名患有罕见且致命性自身免疫疾病——视神经脊髓炎谱系障碍(NMOSD)的患者,在接受异体造血干细胞移植后,病情持续缓解超过15年,目前已恢复正常生活。这一结果提示该实验性疗法值得开展更大规模临床试验。

一项关于 M/M/c 排队模型的经典分析显示,随着后端服务器数量增加,系统在相同利用率下能获得近乎线性的延迟改善,且这种收益在服务器数量不大时已很明显。这对理解现代分布式服务架构、负载均衡设计和云服务成本优化具有重要意义。

SpaceX 于 2026 年 6 月 12 日在纳斯达克上市,估值达 1.77 万亿美元,埃隆·马斯克成为全球首位万亿富翁。然而,许多美国普通投资者担心,通过 401(k) 退休账户和指数基金被动持有的 SpaceX 及其他 AI 公司股票,正将他们卷入一个高度不确定且不透明的“AI 赌场”。

亚马逊旗下 MGM 影业突然放弃了一部几乎制作完成的 Sam Altman 传记片《Artificial》,该片原本由 Luca Guadagnino 执导,展现了 Altman 2023 年被 OpenAI 董事会罢免并复职的过程。这一决定发生在其母公司宣布深化与 OpenAI 的数十亿美元合作之后,外界普…

一项针对24个模型的翻译基准测试证明,在低资源语言(南非荷兰语→英语)的翻译任务中,一个仅18GB的本地模型(gemma-4-12b-qat)与GPT-5、Gemini 2.5 Pro等前沿云模型在语义质量上打成平手,意味着开发者可能不再需要调用昂贵API来完成高质量翻译。

开发者 Jack Ulau 发布了 Ratchet,一个用 Rust 编写的硬件调试与固件刷写工具集,通过内置 MCP(模型上下文协议)服务器,允许 AI 代理直接操作 CH341A 或 CH347 编程器,自动完成 SPI Flash 读取、写入、擦除与 BIOS 修复。它将传统上分散在 flashrom…

智谱 AI 的 GLM 5.2 模型在 Design Arena 网页设计盲测中首次拿总分第一,压过 Anthropic 的 Claude Fable 5 和多个 Opus 版本,同时在推理价格上仅为 Fable 5 的约十分之一。这意味着大模型在“审美+落地”的生成设计能力上,国产模型已走到国际前列,且保持…

思必驰于 6 月 20 日在京东上架了 TalkNote 旗舰款 AI 录音卡,定价 1299 元,主打 4G 蜂窝网络自动上传录音与多语言实时转写,直接对标科大讯飞等竞品,进一步拉低了专业级 AI 录音硬件的入门门槛。