Liquid AI 公布了在 38T 数据集上训练的 8B-A1B MoE 模型

Liquid AI 公布了在 38T 数据集上训练的 8B-A1B MoE 模型

Liquid AI 公布了在 38T 数据集上训练的 8B-A1B MoE 模型

一句话看懂:Liquid AI 发布了 LFM2.5-8B-A1B 模型,这是一款可在入门级笔记本电脑上本地运行的 8B-A1B MoE(混合专家)模型,其预训练数据量从12T令牌大幅扩展至38T,并针对工具调用、长文本处理和低幻觉率进行了专项优化。

事件核心:发生了什么

Liquid AI 于近日正式发布 LFM2.5-8B-A1B 模型。相较于去年10月发布的 LFM2-8B-A1B,新版本在三个关键维度上实现了显著升级:首先,上下文窗口从32,768令牌扩展至128,000令牌,使其能够处理更长的文档和推理链条;其次,预训练数据量从12T令牌提升至38T令牌,并引入了大规模强化学习;最后,模型词汇表规模从65,536翻倍至128,000,大幅提升了在印地语、泰语、越南语、印尼语和阿拉伯语等非拉丁语系语言上的分词效率。模型仅采用推理模式,即在给出最终答案前生成显式思维链。目前,该模型的基座版本(LFM2.5-8B-A1B-Base)和训练后版本均已上线Hugging Face和官方Playground。

为什么重要

LFM2.5-8B-A1B 的意义在于,它展示了在消费级硬件上运行高性能、低幻觉率 MoE 模型的技术可行性。其核心创新在于:通过“平均@k”奖励机制进行针对性强化学习,建立了更清晰的知识边界,模型在不确定时会明确表达而非胡乱猜测。在为普通笔记本电脑设计的边缘模型中,该模型在基准测试中展现出与更大规模模型(如Gemma 4-26B)相当的指令跟随能力,并在Tau2-Telecom等智能体基准测试中表现突出。这预示着未来复杂的AI智能体可以完全在本地设备上运行,无需依赖云端算力,对隐私保护和离线场景意义重大。

对用户/开发者/创作者的影响

对开发者而言,该模型“开箱即用”,官方文档提供了详细的本地运行和微调指南,且已获得llama.cpp等推理生态的实时支持。这意味着开发者可以在普通笔记本电脑上快速搭建本地的、私有化的智能体应用。对于企业用户,尤其是金融服务、医疗等对数据隐私和合规性有严格要求的行业,该模型提供了一个可以在内部部署的高效替代方案。对普通用户而言,这意味着未来的个人电脑将可以独立运行具备强大推理能力的AI助手,而无需上传数据到云端。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,Liquid AI 承诺将在后续博文中披露关于“末日循环”(长时间推理中的重复循环问题)抑制技术的完整实验细节和消融实验数据,这一项技术的透明度将对社区复现和改进至关重要。第二,从边缘模型到端侧Agent的部署路径是否顺畅,将取决于该模型在各类消费级硬件上的实际推理速度和与本地API生态的集成程度。第三,该模型在多语言特别是小语种上的压缩收益,可能会推动更多聚焦非英语市场的AI应用开发者进行迁移或微调。

来源:www.liquid.ai

celebrityanime
celebrityanime
文章: 4466

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注