HuggingFace CEO力荐，Bengio团队也押注：这个1500美元训出的HRM模型，凭什么火了？

一句话看懂：Sapient Intelligence 发布了一个仅 1B 参数、训练成本约 1500 美元的 HRM-Text 模型，在多个推理基准上超越了数千倍训练数据的大模型。它不是“小模型逆袭”，而是在验证“潜空间递归推理”这一全新架构路线的可行性——让模型在输出前，先在内部完成多轮分层计算，而非依赖更长的思维链输出。

事件核心：发生了什么

2026 年 6 月，Sapient Intelligence 发布了 HRM-Text 模型（1B 参数，16 块 H100 训练不到两天，成本约 1500 美元），并同步开源了论文、模型权重和预训练代码。该模型在 MATH（56.2）、GSM8K（84.5）、ARC-Challenge（81.9）、DROP（82.2）等推理密集型基准上的表现，与 2B-7B 参数、使用 9T-36T tokens 训练的 Llama 3.2 3B 和 Qwen3 2B 等主流开源模型相当。HuggingFace CEO Clem Delangue 亲自转发推荐，图灵奖得主 Yoshua Bengio 作为共同作者提出的 GRAM 论文，也采用了相同的分层递归（Hierarchical Reasoning Model, HRM）核心计算结构。

为什么重要

HRM-Text 最重要的信号不是“便宜”或“小”，而是它对下一代推理模型路线的底层挑战。当前主流范式（如 Chain-of-Thought）将推理过程显式写出，存在 token 开销大、中间错误累积、模型可能学会“像推理的文本”而非真正的推理结构等问题。HRM 的路线则是让模型在输出前，于潜空间中通过两个模块（慢速更新、把控整体的高层模块 H，与快速更新、逐层修正的低层模块 L）进行多轮递归计算，将“思考”内化于模型内部。这意味着：模型不再只是更大的知识仓库，而是一个更强的推理核心。它改变的是模型“怎么算”（从流水线到递归迭代）、“学什么”（训练信号集中用于任务完成，而非预测整个文本序列）和“如何稳定训练”（引入 MagicNorm 和 warmup deep credit assignment 解决递归训练中的梯度爆炸问题）。这本质上是一套基础模型设计方法的重构，而非简单的参数或数据优化。

对用户/开发者/创作者的影响

对开发者而言，HRM-Text 的路线提供了一个新的模型选择方向：在需要强推理的任务（如数学解题、逻辑推理、代码生成中的复杂分支）中，可以通过关注 HRM 类架构来获得比同等参数规模传统 Transformer 更优的性能，且训练成本极低，可复现、可验证。目前公开信息显示，该模型尚未以 API 或产品形式落地，但开源状态意味着开发者可以直接下载权重进行微调或部署，适合对推理效率敏感的私有化场景。对 AI 应用创作者来说，HRM 路线降低了“生产一个会思考的模型”的算力和数据门槛——不再依赖数万张 GPU 和 T 级 tokens。对投资者和行业观察者而言，它提示了一个值得关注的技术路线分化：当行业围绕“更大更强”的共识时，Sapient 和 Bengio 团队正在用实践展示“更巧”的可能性。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，HRM-Text 在开放自然语言场景下的泛化能力和知识问答覆盖度仍需验证，尤其是知识密集型任务（如事实性 QA、长文档理解）的表现尚未披露。第二，Sapient 是否会将 HRM 架构从文本扩展到多模态（如图像推理、视觉-语言联合任务），以及是否计划推出 API 服务，目前公开信息未提及。第三，主要开源生态（如 HuggingFace Transformers）是否原生支持 HRM 架构的训练和推理，以及 Llama、Qwen 等主流模型是否会考虑引入类似的分层递归结构，将是该路线能否从论文走向工程复用的关键指标。

来源：量子位 · 每日最新

HuggingFace CEO力荐，Bengio团队也押注：这个1500美元训出的HRM模型，凭什么火了？

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

[人工智能] 分享一下我试用过的几款 AI 套餐

3只核心人工智能（AI）股票：现在用1000美元买入，并持有未来十年

消息人士称，OpenAI正受到各州总检察长组成的团体调查

发表回复取消回复