摩尔线程开源 MusaCoder：首个基于国产全功能 GPU 全栈训练的代码大模型

一句话看懂：摩尔线程于6月10日开源了名为MusaCoder的代码生成大模型，这是首个完全基于国产GPU（MTT S5000）完成训练和验证的此类模型，专为自动生成GPU底层Kernel代码而设计，在性能评测上超越Claude Opus 4.7等多款主流模型。

事件核心：发生了什么

摩尔线程发布并开源了MusaCoder，包含9B和27B两个参数版本。该模型的重点并非通用代码生成，而是面向GPU底层算子（如PyTorch标准算子）生成高性能的CUDA或MUSA原生Kernel代码。其完整后训练流程均在基于摩尔线程MTT S5000 GPU构建的夸娥智算集群上完成，因此被定义为“首个基于国产全功能GPU全栈训练的开源代码大模型”。根据官方公布的KernelBench评测数据，MusaCoder-27B-RL版本在Overall Pass@8和Avg.@8两项指标上分别达到93.2%和88.60%，超越了Claude Opus 4.7、DeepSeek-V4 Pro等业界领先模型。模型相关代码和论文已分别在Hugging Face和arXiv上公开。

为什么重要

这一事件的关键意义在于打破了“训练AI模型必须依赖海外高端GPU”的固有认知。MusaCoder证明了国产GPU（MTT S5000）不仅能够支撑大模型训练，还能在特定且高价值的代码生成任务（GPU Kernel代码）中产出具有国际竞争力的模型。这直接增强了国产算力在AI开发工具链中的可用性和说服力。同时，该模型专注降低GPU底层编程的门槛，对于提升国产GPU生态的软件开发效率和易用性有实际推动作用，而非停留于理论或口号。此外，其在KernelBench上的成绩也为国产AI技术在细分领域实现“局部超车”提供了一个可验证的案例。

对用户/开发者/创作者的影响

对GPU开发者而言，这是一款直接的生产力工具。过去，手写CUDA或MUSA Kernel代码需要深厚的底层硬件知识和大量手动调优时间，MusaCoder能够从PyTorch标准算子描述自动生成高性能代码，有望将这个过程的耗时从数天缩短到数分钟。对于使用国产GPU（如摩尔线程MTT系列）的开发者，这意味着可以获得一个与自身硬件深度适配且开源的代码生成助手，降低开发门槛。对于AI应用开发者，间接影响是国产算力生态的成熟可能带来更低的推理和训练成本。目前该模型已开源，开发者可以直接从Hugging Face下载使用。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，MusaCoder能否在更广泛的真实开发场景中复现Benchmark上的高表现，以及其生成的代码在实际部署中的稳定性和性能一致性需要社区验证。第二，摩尔线程是否会围绕MusaCoder推出商业化的工具链或云服务（如API调用），这将影响其变现模式和开发者覆盖范围。第三，其他国产GPU厂商（如华为昇腾、海光DCU）是否会快速跟进，开源类似的“自产自训”代码生成模型，这将决定这一领域的竞争格局。目前公开信息显示，该模型的训练规模、数据集细节以及是否对其他国产GPU（而非仅MTT S5000）具有通用性，还有待进一步披露。

来源：Readhub · AI

摩尔线程开源 MusaCoder：首个基于国产全功能 GPU 全栈训练的代码大模型