HuggingFace CEO力荐,Bengio团队也押注:这个1500美元训出的HRM模型,凭什么火了?

Sapient Intelligence 发布了一个仅 1B 参数、训练成本约 1500 美元的 HRM-Text 模型,在多个推理基准上超越了数千倍训练数据的大模型。它不是“小模型逆袭”,而是在验证“潜空间递归推理”这一全新架构路线的可行性——让模型在输出前,先在内部完成多轮分层计算,而非依赖更长的思维链输…

HuggingFace CEO力荐,Bengio团队也押注:这个1500美元训出的HRM模型,凭什么火了?

一句话看懂:Sapient Intelligence 发布了一个仅 1B 参数、训练成本约 1500 美元的 HRM-Text 模型,在多个推理基准上超越了数千倍训练数据的大模型。它不是“小模型逆袭”,而是在验证“潜空间递归推理”这一全新架构路线的可行性——让模型在输出前,先在内部完成多轮分层计算,而非依赖更长的思维链输出。

事件核心:发生了什么

2026 年 6 月,Sapient Intelligence 发布了 HRM-Text 模型(1B 参数,16 块 H100 训练不到两天,成本约 1500 美元),并同步开源了论文、模型权重和预训练代码。该模型在 MATH(56.2)、GSM8K(84.5)、ARC-Challenge(81.9)、DROP(82.2)等推理密集型基准上的表现,与 2B-7B 参数、使用 9T-36T tokens 训练的 Llama 3.2 3B 和 Qwen3 2B 等主流开源模型相当。HuggingFace CEO Clem Delangue 亲自转发推荐,图灵奖得主 Yoshua Bengio 作为共同作者提出的 GRAM 论文,也采用了相同的分层递归(Hierarchical Reasoning Model, HRM)核心计算结构。

为什么重要

HRM-Text 最重要的信号不是“便宜”或“小”,而是它对下一代推理模型路线的底层挑战。当前主流范式(如 Chain-of-Thought)将推理过程显式写出,存在 token 开销大、中间错误累积、模型可能学会“像推理的文本”而非真正的推理结构等问题。HRM 的路线则是让模型在输出前,于潜空间中通过两个模块(慢速更新、把控整体的高层模块 H,与快速更新、逐层修正的低层模块 L)进行多轮递归计算,将“思考”内化于模型内部。这意味着:模型不再只是更大的知识仓库,而是一个更强的推理核心。它改变的是模型“怎么算”(从流水线到递归迭代)、“学什么”(训练信号集中用于任务完成,而非预测整个文本序列)和“如何稳定训练”(引入 MagicNorm 和 warmup deep credit assignment 解决递归训练中的梯度爆炸问题)。这本质上是一套基础模型设计方法的重构,而非简单的参数或数据优化。

对用户/开发者/创作者的影响

对开发者而言,HRM-Text 的路线提供了一个新的模型选择方向:在需要强推理的任务(如数学解题、逻辑推理、代码生成中的复杂分支)中,可以通过关注 HRM 类架构来获得比同等参数规模传统 Transformer 更优的性能,且训练成本极低,可复现、可验证。目前公开信息显示,该模型尚未以 API 或产品形式落地,但开源状态意味着开发者可以直接下载权重进行微调或部署,适合对推理效率敏感的私有化场景。对 AI 应用创作者来说,HRM 路线降低了“生产一个会思考的模型”的算力和数据门槛——不再依赖数万张 GPU 和 T 级 tokens。对投资者和行业观察者而言,它提示了一个值得关注的技术路线分化:当行业围绕“更大更强”的共识时,Sapient 和 Bengio 团队正在用实践展示“更巧”的可能性。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,HRM-Text 在开放自然语言场景下的泛化能力和知识问答覆盖度仍需验证,尤其是知识密集型任务(如事实性 QA、长文档理解)的表现尚未披露。第二,Sapient 是否会将 HRM 架构从文本扩展到多模态(如图像推理、视觉-语言联合任务),以及是否计划推出 API 服务,目前公开信息未提及。第三,主要开源生态(如 HuggingFace Transformers)是否原生支持 HRM 架构的训练和推理,以及 Llama、Qwen 等主流模型是否会考虑引入类似的分层递归结构,将是该路线能否从论文走向工程复用的关键指标。

来源:量子位 · 每日最新

celebrityanime
celebrityanime
文章: 7542

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注