Liquid AI 公布了在 38T 数据集上训练的 8B-A1B MoE 模型

一句话看懂：Liquid AI 发布了 LFM2.5-8B-A1B 模型，这是一款可在入门级笔记本电脑上本地运行的 8B-A1B MoE（混合专家）模型，其预训练数据量从12T令牌大幅扩展至38T，并针对工具调用、长文本处理和低幻觉率进行了专项优化。

事件核心：发生了什么

Liquid AI 于近日正式发布 LFM2.5-8B-A1B 模型。相较于去年10月发布的 LFM2-8B-A1B，新版本在三个关键维度上实现了显著升级：首先，上下文窗口从32,768令牌扩展至128,000令牌，使其能够处理更长的文档和推理链条；其次，预训练数据量从12T令牌提升至38T令牌，并引入了大规模强化学习；最后，模型词汇表规模从65,536翻倍至128,000，大幅提升了在印地语、泰语、越南语、印尼语和阿拉伯语等非拉丁语系语言上的分词效率。模型仅采用推理模式，即在给出最终答案前生成显式思维链。目前，该模型的基座版本（LFM2.5-8B-A1B-Base）和训练后版本均已上线Hugging Face和官方Playground。

为什么重要

LFM2.5-8B-A1B 的意义在于，它展示了在消费级硬件上运行高性能、低幻觉率 MoE 模型的技术可行性。其核心创新在于：通过“平均@k”奖励机制进行针对性强化学习，建立了更清晰的知识边界，模型在不确定时会明确表达而非胡乱猜测。在为普通笔记本电脑设计的边缘模型中，该模型在基准测试中展现出与更大规模模型（如Gemma 4-26B）相当的指令跟随能力，并在Tau2-Telecom等智能体基准测试中表现突出。这预示着未来复杂的AI智能体可以完全在本地设备上运行，无需依赖云端算力，对隐私保护和离线场景意义重大。

对用户/开发者/创作者的影响

对开发者而言，该模型“开箱即用”，官方文档提供了详细的本地运行和微调指南，且已获得llama.cpp等推理生态的实时支持。这意味着开发者可以在普通笔记本电脑上快速搭建本地的、私有化的智能体应用。对于企业用户，尤其是金融服务、医疗等对数据隐私和合规性有严格要求的行业，该模型提供了一个可以在内部部署的高效替代方案。对普通用户而言，这意味着未来的个人电脑将可以独立运行具备强大推理能力的AI助手，而无需上传数据到云端。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，Liquid AI 承诺将在后续博文中披露关于“末日循环”（长时间推理中的重复循环问题）抑制技术的完整实验细节和消融实验数据，这一项技术的透明度将对社区复现和改进至关重要。第二，从边缘模型到端侧Agent的部署路径是否顺畅，将取决于该模型在各类消费级硬件上的实际推理速度和与本地API生态的集成程度。第三，该模型在多语言特别是小语种上的压缩收益，可能会推动更多聚焦非英语市场的AI应用开发者进行迁移或微调。

来源：www.liquid.ai

Liquid AI 公布了在 38T 数据集上训练的 8B-A1B MoE 模型