端侧大模型迎突破！Liquid AI 开源混合专家模型 LFM2.5

一句话看懂：人工智能初创公司 Liquid AI 于今日正式发布并开源了新型端侧大模型 LFM2.5-8B-A1B。该模型专为消费级硬件上的工具调用和复杂指令跟踪设计，在保持极低计算成本的同时，显著提升了边缘设备的推理和推断性能，为在手机、笔记本等本地设备上运行高性能 AI 提供了可行方案。

事件核心：发生了什么

5 月 29 日，Liquid AI 宣布开源其最新的端侧大模型 LFM2.5-8B-A1B。该模型采用稀疏混合专家（MoE）架构，总参数量为 83 亿，得益于稀疏性，每次 token 生成仅激活 15 亿参数，使其能够在智能手机和笔记本电脑等本地设备上流畅运行。相比上一代，LFM2.5 的上下文窗口从 32K tokens 扩展至 128K tokens，预训练数据量也从 12T 增至 38T。作为一个纯推理模型，它在输出最终答案前会生成显式推理链，其高度压缩的词汇表能有效处理包括中文和阿拉伯语在内的九种语言。为解决长推理中的逻辑死循环和幻觉问题，开发团队引入了两阶段强化学习训练，通过偏好优化和专门的抗幻觉奖励机制，使模型能主动拒绝回答超出知识范围的问题。

为什么重要

LFM2.5 的发布标志着端侧大模型在技术路线上取得了实质性突破。传统上，高性能大模型依赖云端算力，存在高延迟、隐私风险和网络依赖等问题。LFM2.5 通过 MoE 架构在极小激活参数下实现了媲美更大规模模型的指令跟踪和逻辑推理能力，其解码速度在 M5 Max 芯片上达到每秒 253 字节，移动设备上约为每秒 30 字节。这意味着端侧 AI 从“可用”迈向了“好用”，有望改变当前大模型主要集中于数据中心的应用格局，推动隐私保护、低延迟的本地 AI 应用进入快速增长期。同时，该模型对 llama.cpp、MLX、vLLM 和 SGLang 等主流推理生态的全面支持，也大幅降低了开发者的集成门槛。

对用户/开发者/创作者的影响

对于普通用户而言，LFM2.5 的落地将带来更流畅、更私密的本地 AI 助手体验，例如离线实时翻译、文档摘要和智能问答，无需联网即可获得高质量响应。对于开发者和企业，模型的开源性质使他们能够基于消费级硬件构建定制化的 AI 应用，如本地化的客服系统、自动化工作流中的工具调用等，同时降低了对昂贵云算力的依赖和隐私合规风险。对内容创作者来说，该模型在长文本处理和复杂指令执行上的提升，意味着可以本地完成诸如剧本改写、多语言内容创作等任务，创作效率有望显著提高。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

目前公开信息显示，三个关键观察点值得持续跟踪：第一，LFM2.5 在实际各种边缘硬件上的性能表现，尤其是除 M5 Max 和移动设备外的广泛设备兼容性；第二，该模型能否在开发者社区形成规模效应，吸引更多第三方应用和工具链的接入；第三，竞品如 Meta、Google 等是否会加快推出类似端侧模型的进展，从而推动整个赛道的技术迭代和成本下降。

来源：AIbase

端侧大模型迎突破！Liquid AI 开源混合专家模型 LFM2.5