马斯克说明年 Q1,唐杰说用不了那么久,谁在闷头做中国的 Mythos?

Anthropic 的顶级模型 Mythos 被美国政府限制对华出口后,马斯克预计中国需 9 个月才能追上,但智谱首席科学家唐杰认为更快。背后关键在于,除了智谱的基座迭代,一家名为 Mind Lab 的团队已独家完成 GLM-5.1/5.2 后训练并显著提分,可能成为追赶 Mythos 级别智能的另一条路径。

马斯克说明年 Q1,唐杰说用不了那么久,谁在闷头做中国的 Mythos?

一句话看懂:Anthropic 的顶级模型 Mythos 被美国政府限制对华出口后,马斯克预计中国需 9 个月才能追上,但智谱首席科学家唐杰认为更快。背后关键在于,除了智谱的基座迭代,一家名为 Mind Lab 的团队已独家完成 GLM-5.1/5.2 后训练并显著提分,可能成为追赶 Mythos 级别智能的另一条路径。

事件核心:发生了什么

Mythos 被美国禁止对华销售后,中国能否自研同等能力模型引发讨论。马斯克在 X 平台预估需要 9 个月,智谱首席科学家唐杰则回应“用不了那么久”。唐杰的底气源于智谱刚发布的 GLM-5.2——该模型评测全面逼近前沿,基座能力较 5.1 显著跃升。但更关键的是,后训练技术正在释放这些基座的潜力:机器之心发现,一家名为 Mind Lab(隶属心洲科技)的团队,是目前全球唯一完成 GLM-5.1/5.2 全流程后训练并开源的外部团队。其基于 GLM-5.1 后训练的模型 Macaron-V1-Preview,在 PinchBench 上从基座 76.6 分提升至 92.5 分(相对提升 20.8%),Terminal-Bench 2.0 从 63.5 分提升至 67.4 分。GLM-5.2 发布后,Mind Lab 已第一时间完成对新架构 IndexCache 的适配并开源。

为什么重要

Mythos 的出口限制意味着中国 AI 产业无法直接获取该能力,必须依靠自研。目前公开信息显示,追赶 Mythos 级别的智能不能仅靠基座预训练迭代——OpenAI 的 o1、Anthropic 的 Constitutional AI 都证明了后训练技术的核心作用。而 Mind Lab 占据了一个稀缺生态位:它既能理解 GLM 基座中 MTP、DSA 等 700B 以上模型才使用的架构,又拥有自己的训练基础设施(开源了支持 GLM-5.1/5.2 的 Megatron 框架),且迭代周期按周计算,比基座训练的按月计算更快。这意味着,在“从智谱新基座到 Mythos 级别产品”的链条中,Mind Lab 可能成为后训练能力的关键外循环,而不仅依赖智谱内部。若基座能力继续提升,叠加已验证的提分空间,这条技术路线的速度可能超出预期。

对用户/开发者/创作者的影响

对开发者而言,Mind Lab 已开源 GLM 系列后训练框架和适配方案,可直接在此基础上定制模型,降低从 0 到 1 的工程门槛。对企业用户来说,若后续基于 GLM-5.2 的后训练模型能稳定输出更高评测成绩,意味着可在不更换基座模型供应商的情况下获得性能跃升,减少采购风险。对内容创作和 AI 应用开发者,后训练带来的能力释放(如更高准确率和更长上下文理解)将直接转化为产品体验提升,比如更精准的 Agent 执行或更长的文档分析。但需注意:目前后训练能力仅验证于 GLM 系列,是否可迁移至其他基座尚不明确。

值得关注的后续

1. GLM-5.2 后训练成果何时发布:Mind Lab 已宣布启动支持,但实际提分数据和评测结果尚未公开,这是验证路径能否延续的关键节点。2. 智谱年底新基座是否会进一步拉大差距:若基座能力大幅提升,Mind Lab 的后训练提分能力能否叠加出接近 Mythos 的效果,将成为重要观察点。3. 是否会有更多团队进入后训练赛道:目前除智谱外只有 Mind Lab 交出公开成果,若后训练价值被更广泛认可,可能引发行业关注,但技术门槛较高,短期难以大量复制。

来源:Readhub · AI

celebrityanime
celebrityanime
文章: 9034

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注