美团的 LongCat-2.0 表明中国可以在没有 Nvidia 的情况下训练大规模人工智能模型

美团宣布成功训练出参数量达 1.6 万亿的 AI 模型 LongCat-2.0,整个训练过程完全依赖超过 5 万块国产 AI ASIC 芯片,没有使用任何 Nvidia 硬件。这一成果直接回应了自 2022 年开始的美国出口管制,证明中国在万亿参数级大模型训练上已具备“纯国产”算力替代方案。

美团的 LongCat-2.0 表明中国可以在没有 Nvidia 的情况下训练大规模人工智能模型

一句话看懂:美团宣布成功训练出参数量达 1.6 万亿的 AI 模型 LongCat-2.0,整个训练过程完全依赖超过 5 万块国产 AI ASIC 芯片,没有使用任何 Nvidia 硬件。这一成果直接回应了自 2022 年开始的美国出口管制,证明中国在万亿参数级大模型训练上已具备“纯国产”算力替代方案。

事件核心:发生了什么

美团旗下成立于 2023 年的 LongCat 团队,在超过 5 万块国产专用 AI 芯片组成的计算集群上,完成了 LongCat-2.0 模型的训练,训练数据规模超过 35 万亿 tokens。该团队的第一代模型于 2024 年底发布。在性能评测方面,LongCat-2.0 在 SWE-bench Pro(59.5 分)和 SWE-bench Multilingual(77.3 分)上超过了 Gemini 3.1 Pro 和 GPT-5.5,但落后于 Claude Opus 4.7 和 4.8;在 IFEval、IMO-AnswerBench、GPQA-diamond 等基准测试上,则与 Gemini 和 GPT-5.5 存在明显差距。目前该模型尚未在 HuggingFace 上开源,独立验证暂时无法进行,美团也未披露具体使用的国产芯片厂商。

为什么重要

LongCat-2.0 的突破性在于它验证了一条绕开 Nvidia CUDA 生态的国产技术路线。在 2022 年美国对华先进芯片出口管制生效后,中国 AI 企业面临高性能 GPU 供应受限的问题。美团的实践表明,通过大规模集群优化和自研芯片协同,万亿参数级模型可以用国产 ASIC 芯片完成训练。这不仅影响了中国本土 AI 算力供应链的自主性判断,也意味着未来全球大模型训练的硬件格局可能从“Nvidia 一家独大”走向多供应商竞争。对行业而言,它证明“算力断供”并非不可逾越的障碍,关键在于算法、框架与硬件的深度协同。

对用户/开发者/创作者的影响

对于普通用户和开发者,目前 LongCat-2.0 尚未开源或开放 API,短期内无法直接使用该模型。但这一进展的长期影响在于:如果国产芯片集群能持续稳定地训练出与世界前沿竞争的大模型,未来中国 AI 产品的算力成本可能更低、供应链更安全,从而降低从企业采购到个人开发的使用门槛。对于依赖 Nvidia GPU 进行模型训练的创业团队和企业,LongCat-2.0 提供了一个可参考的国产替代方案样例,但需要关注其实训框架、芯片兼容性和部署效率是否具备可复制性。对于 AI 政策与合规领域的观察者,该成果也将影响各国对“技术封锁”效果的评估。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

首先,LongCat-2.0 是否会在 HuggingFace 等平台开源或提供 API 服务,将是衡量其技术成熟度和产业落地意愿的关键信号。其次,美团未公布的国产芯片供应商信息值得追踪——是华为昇腾、寒武纪还是其他厂商,将直接影响市场对国产 AI 芯片商业竞争力的判断。最后,LongCat-2.0 在部分基准测试上仍落后于 Claude 和最新 GPT 系列,后续版本能否在推理、数学等任务上追平差距,将决定其是否能真正进入一线模型竞争序列。

来源:The Decoder AI News

celebrityanime
celebrityanime
文章: 10756

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注