美团 LongCat-2.0 正式发布:国产算力集群训练的万亿参数大模型

6月30日,美团正式发布并开源万亿参数大模型 LongCat-2.0(总参数1.6T,平均激活约48B),这是业界首个在五万卡国产算力集群上完成全流程训练与推理的模型。该模型已跻身全球开发者平台 OpenRouter 调用量前三,成为 Agent 开发者最欢迎的模型之一。

美团 LongCat-2.0 正式发布:国产算力集群训练的万亿参数大模型

一句话看懂:6月30日,美团正式发布并开源万亿参数大模型 LongCat-2.0(总参数1.6T,平均激活约48B),这是业界首个在五万卡国产算力集群上完成全流程训练与推理的模型。该模型已跻身全球开发者平台 OpenRouter 调用量前三,成为 Agent 开发者最欢迎的模型之一。

事件核心:发生了什么

LongCat-2.0 是一款基于 MoE(混合专家)架构的万亿参数大模型,从零开始预训练,原生支持 1M 超长上下文。它由美团龙猫团队在五万卡国产算力集群上完成训练,预训练数据规模超过 30T tokens。技术层面,团队攻克了国产算力在稳定性、正确性和效率上的三大难题:通过自动故障恢复将月均日故障率降低 70% 以上;通过自研确定性算子保障训练正确性;通过流水线调度和显存优化使训练 MFU(模型算力利用率)提升 1.5 倍,稳态日吞吐达到 1T tokens/day。在推理阶段,模型通过大规模专家并行、零计算专家机制,以及核心算子调度优化,实现了低延迟解码。

为什么重要

这是国产大模型在“国产算力+Agent 应用”方向上的一次实质性验证。过去,万亿参数模型训练高度依赖英伟达 GPU 集群,LongCat-2.0 通过五万卡国产算力的全流程成功,证明国内已具备大规模模型自训的能力。模型直接面向 Agentic Coding(智能体编程)场景优化,采用 LSA 稀疏注意力机制和 ScMoE 架构,实现 token 级动态激活(33B~56B),并通过 MOPD 多专家融合架构(Agent、Reasoning、Interaction 三组专家),在编程、推理、交互三个维度表现均衡。从开源策略看,美团将模型在 OpenRouter 平台开放调用并已积累全球前三的调用量数据,显示其在开发者生态中获得了真实落地验证。

对用户/开发者/创作者的影响

对 Agent 开发者:LongCat-2.0 原生支持 1M 超长上下文,适合处理大型代码库理解、多步骤工具调用和长程推理任务。零计算专家机制降低了推理成本,简单 token 不消耗算力,适用于高频、请求多样化的 Agent 场景。模型已在真实工作中被用于搭建 AI SQL Agent(自然语言查询数据)、代码库迁移、完整应用开发(从一句话到可运行产品)以及3D交互演示生成等任务。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

对企业用户:模型在编程评测 SWE-bench Pro 中得分 59.5,在 SWE-bench Multilingual 中得 77.3,在真实终端指令交互评测 Terminal-Bench 2.1 中得 70.8,均达到或接近 GPT-5.5、Claude Opus 4.6 等闭源模型水平。在搜索智能体(RWSearch)和生产力场景(FORTE)等办公评测中也表现均衡,适合企业级 Agent 落地。

对创作者:模型在“一句话生成应用”和“AI 小说工厂”等场景中展示了端到端内容生成能力,可自动完成从创意到多平台发布的全链路任务。

值得关注的后续

第一,国产算力训练是否会被扩展到更大规模(如十万卡),以及相关训练框架是否会对外开源。第二,LongCat-2.0 在真实企业级 Agent 场景中的商业变现路径,美团是否会推出付费 API 或企业定制方案。第三,由于模型已跻身 OpenRouter 全球前三,其他主流国产大模型(如 DeepSeek、智谱等)是否会跟进类似 Agent 优先的技术路线或加速开源策略。

来源:公众号:龙猫LongCat(美团)

celebrityanime
celebrityanime
文章: 10722

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注