
一句话看懂:Sapient Intelligence 发布了一个仅 1B 参数、训练成本约 1500 美元的 HRM-Text 模型,在多个推理基准上超越了数千倍训练数据的大模型。它不是“小模型逆袭”,而是在验证“潜空间递归推理”这一全新架构路线的可行性——让模型在输出前,先在内部完成多轮分层计算,而非依赖更长的思维链输出。
事件核心:发生了什么
2026 年 6 月,Sapient Intelligence 发布了 HRM-Text 模型(1B 参数,16 块 H100 训练不到两天,成本约 1500 美元),并同步开源了论文、模型权重和预训练代码。该模型在 MATH(56.2)、GSM8K(84.5)、ARC-Challenge(81.9)、DROP(82.2)等推理密集型基准上的表现,与 2B-7B 参数、使用 9T-36T tokens 训练的 Llama 3.2 3B 和 Qwen3 2B 等主流开源模型相当。HuggingFace CEO Clem Delangue 亲自转发推荐,图灵奖得主 Yoshua Bengio 作为共同作者提出的 GRAM 论文,也采用了相同的分层递归(Hierarchical Reasoning Model, HRM)核心计算结构。
为什么重要
HRM-Text 最重要的信号不是“便宜”或“小”,而是它对下一代推理模型路线的底层挑战。当前主流范式(如 Chain-of-Thought)将推理过程显式写出,存在 token 开销大、中间错误累积、模型可能学会“像推理的文本”而非真正的推理结构等问题。HRM 的路线则是让模型在输出前,于潜空间中通过两个模块(慢速更新、把控整体的高层模块 H,与快速更新、逐层修正的低层模块 L)进行多轮递归计算,将“思考”内化于模型内部。这意味着:模型不再只是更大的知识仓库,而是一个更强的推理核心。它改变的是模型“怎么算”(从流水线到递归迭代)、“学什么”(训练信号集中用于任务完成,而非预测整个文本序列)和“如何稳定训练”(引入 MagicNorm 和 warmup deep credit assignment 解决递归训练中的梯度爆炸问题)。这本质上是一套基础模型设计方法的重构,而非简单的参数或数据优化。
对用户/开发者/创作者的影响
对开发者而言,HRM-Text 的路线提供了一个新的模型选择方向:在需要强推理的任务(如数学解题、逻辑推理、代码生成中的复杂分支)中,可以通过关注 HRM 类架构来获得比同等参数规模传统 Transformer 更优的性能,且训练成本极低,可复现、可验证。目前公开信息显示,该模型尚未以 API 或产品形式落地,但开源状态意味着开发者可以直接下载权重进行微调或部署,适合对推理效率敏感的私有化场景。对 AI 应用创作者来说,HRM 路线降低了“生产一个会思考的模型”的算力和数据门槛——不再依赖数万张 GPU 和 T 级 tokens。对投资者和行业观察者而言,它提示了一个值得关注的技术路线分化:当行业围绕“更大更强”的共识时,Sapient 和 Bengio 团队正在用实践展示“更巧”的可能性。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,HRM-Text 在开放自然语言场景下的泛化能力和知识问答覆盖度仍需验证,尤其是知识密集型任务(如事实性 QA、长文档理解)的表现尚未披露。第二,Sapient 是否会将 HRM 架构从文本扩展到多模态(如图像推理、视觉-语言联合任务),以及是否计划推出 API 服务,目前公开信息未提及。第三,主要开源生态(如 HuggingFace Transformers)是否原生支持 HRM 架构的训练和推理,以及 Llama、Qwen 等主流模型是否会考虑引入类似的分层递归结构,将是该路线能否从论文走向工程复用的关键指标。
来源:量子位 · 每日最新
![[人工智能] 分享一下我试用过的几款 AI 套餐](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_5-537-768x403.jpg)

