面壁智能等开源首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN

一句话看懂：面壁智能联合清华大学、OpenBMB 社区，正式发布并开源了 BitCPM-CANN。这是中国首个完全基于华为昇腾算力平台完成端到端训练并开源的三值（1.58-bit）大模型。其核心价值在于，通过极致的量化技术，让大模型在同等内存下性能提升约 6 倍，甚至有望在未来让手机运行千亿参数级别的模型。

事件核心：发生了什么

5 月 25 日，面壁智能宣布 BitCPM-CANN 正式发布并开源。该模型此前于 5 月 23 日在华为鲲鹏昇腾开发者大会（KADC 2026）首次技术亮相。相比传统 BF16 精度，BitCPM-CANN 在推理阶段释放了约 6 倍的显存红利，同时模型能力保留率保持在 90%–97.2% 之间。这意味着，同样大小的终端内存可以承载远超以往的模型能力，或者反过来说，运行相同能力的模型只需要过去 1/6 的内存。例如，若将终端内存扩大到 8GB，理论上可支持运行参数规模达 60B 的大模型。

为什么重要

这一成果在技术和产业两个层面具有标志性意义。技术层面，“2-bit 量化”是端侧芯片行业近年热门研究方向，也是将大模型塞进手机、PC 等终端设备的主要卡点。BitCPM-CANN 将模型权重压缩 6-8 倍，配合 MoE（混合专家模型）与激活范围约束等技术，让 4GB 内存能运行 16B 参数模型，8GB 内存能运行 60B 参数模型，极大突破了端侧大模型的部署极限。产业层面，这是首个完全基于华为昇腾算力平台训练的 1.58-bit 开源模型，意味着国产算力生态（华为昇腾）与高效大模型训练技术（面壁智能“小钢炮”系列）实现了深度耦合，为国内自主可控的 AI 硬件与软件生态提供了一份可验证的答卷。

对用户/开发者/创作者的影响

对普通用户：BitCPM-CANN 的开源和高效压缩，意味着未来手机、平板等移动设备可能无须联网即可运行本地大模型，隐私性更好、响应更快。例如，手机上运行 60B 级别大模型变得可能，将大幅提升手机端的智能助手、实时翻译、图像生成等体验。对开发者：模型已开源，开发者可以在国产昇腾硬件上直接部署和微调，降低了端侧大模型开发的门槛。开发者可利用其 1.58-bit 量化特性，在内存受限的终端设备上构建更复杂的 AI 应用。对行业创作者：本地化运行能力意味着内容生成（如文案、视频脚本、图像设计）可以更流畅地集成到消费级设备中，无需依赖云端算力，降低了使用成本和延迟。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，BitCPM-CANN 是否真的能落地到主流消费电子产品中，例如华为手机或平板等搭载昇腾芯片的设备，需要等待具体的产品化进展。第二，这一技术路径是否会引发竞品跟进，如高通、联发科等芯片厂商是否会推出适配类似量化策略的硬件优化方案。第三，开源生态的活跃度：面壁智能及 OpenBMB 社区是否能吸引更多开发者围绕该模型构建应用和工具链，从而推动国产端侧大模型的商业化和普及。目前公开信息显示，开源工作已正式启动，但模型在更多终端设备上的实际性能表现和开发者反馈还需要时间验证。

来源：Readhub · AI

面壁智能等开源首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN