美团的 LongCat-2.0 表明中国可以在没有 Nvidia 的情况下训练大规模人工智能模型

一句话看懂：美团宣布成功训练出参数量达 1.6 万亿的 AI 模型 LongCat-2.0，整个训练过程完全依赖超过 5 万块国产 AI ASIC 芯片，没有使用任何 Nvidia 硬件。这一成果直接回应了自 2022 年开始的美国出口管制，证明中国在万亿参数级大模型训练上已具备“纯国产”算力替代方案。

事件核心：发生了什么

美团旗下成立于 2023 年的 LongCat 团队，在超过 5 万块国产专用 AI 芯片组成的计算集群上，完成了 LongCat-2.0 模型的训练，训练数据规模超过 35 万亿 tokens。该团队的第一代模型于 2024 年底发布。在性能评测方面，LongCat-2.0 在 SWE-bench Pro（59.5 分）和 SWE-bench Multilingual（77.3 分）上超过了 Gemini 3.1 Pro 和 GPT-5.5，但落后于 Claude Opus 4.7 和 4.8；在 IFEval、IMO-AnswerBench、GPQA-diamond 等基准测试上，则与 Gemini 和 GPT-5.5 存在明显差距。目前该模型尚未在 HuggingFace 上开源，独立验证暂时无法进行，美团也未披露具体使用的国产芯片厂商。

为什么重要

LongCat-2.0 的突破性在于它验证了一条绕开 Nvidia CUDA 生态的国产技术路线。在 2022 年美国对华先进芯片出口管制生效后，中国 AI 企业面临高性能 GPU 供应受限的问题。美团的实践表明，通过大规模集群优化和自研芯片协同，万亿参数级模型可以用国产 ASIC 芯片完成训练。这不仅影响了中国本土 AI 算力供应链的自主性判断，也意味着未来全球大模型训练的硬件格局可能从“Nvidia 一家独大”走向多供应商竞争。对行业而言，它证明“算力断供”并非不可逾越的障碍，关键在于算法、框架与硬件的深度协同。

对用户/开发者/创作者的影响

对于普通用户和开发者，目前 LongCat-2.0 尚未开源或开放 API，短期内无法直接使用该模型。但这一进展的长期影响在于：如果国产芯片集群能持续稳定地训练出与世界前沿竞争的大模型，未来中国 AI 产品的算力成本可能更低、供应链更安全，从而降低从企业采购到个人开发的使用门槛。对于依赖 Nvidia GPU 进行模型训练的创业团队和企业，LongCat-2.0 提供了一个可参考的国产替代方案样例，但需要关注其实训框架、芯片兼容性和部署效率是否具备可复制性。对于 AI 政策与合规领域的观察者，该成果也将影响各国对“技术封锁”效果的评估。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

首先，LongCat-2.0 是否会在 HuggingFace 等平台开源或提供 API 服务，将是衡量其技术成熟度和产业落地意愿的关键信号。其次，美团未公布的国产芯片供应商信息值得追踪——是华为昇腾、寒武纪还是其他厂商，将直接影响市场对国产 AI 芯片商业竞争力的判断。最后，LongCat-2.0 在部分基准测试上仍落后于 Claude 和最新 GPT 系列，后续版本能否在推理、数学等任务上追平差距，将决定其是否能真正进入一线模型竞争序列。

来源：The Decoder AI News

美团的 LongCat-2.0 表明中国可以在没有 Nvidia 的情况下训练大规模人工智能模型

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

你天天用的Claude和Codex，Meta内部不让随便用了

两个行业每月减少 2.8 万个工作岗位 AI 对就业的影响昭然若揭

OceanBase湖库一体，重新定义AI数据库

发表回复取消回复