Day-0 支持,摩尔线程完成 MiniMax M3 大模型适配

6月12日,MiniMax开源旗舰多模态模型M3,摩尔线程在同日完成适配,其MTT S5000智算卡已能为M3提供从训练到推理的全链路算力支持。这意味着国产大模型在国产GPU上的部署速度正在追上国际节奏。

Day-0 支持,摩尔线程完成 MiniMax M3 大模型适配

一句话看懂:6月12日,MiniMax开源旗舰多模态模型M3,摩尔线程在同日完成适配,其MTT S5000智算卡已能为M3提供从训练到推理的全链路算力支持。这意味着国产大模型在国产GPU上的部署速度正在追上国际节奏。

事件核心:发生了什么

6月12日,MiniMax发布并开源了新一代原生多模态模型M3,拥有百万token级超长上下文窗口,并强化了代码生成和智能体(Agent)能力。同一天,摩尔线程宣布其训推一体智算卡MTT S5000已实现对该模型的Day-0适配。具体优化包括:利用硬件级FP8加速(单卡稠密算力1000 TFLOPS)和80GB显存、1.6TB/s带宽来支撑超长序列的KV Cache存储;通过MUSA C++与Triton-MUSA抽象层快速迁移新算子;并在vLLM和SGLang两大主流推理框架上同步拉起,以开源生态提供部署选择。

为什么重要

这次适配打破了以往“模型发布后需数周甚至数月才能适配国产硬件”的惯例,首次实现了国产模型与国产GPU在开源当天的同步适配。从技术路径看,摩尔线程通过此前在DeepSeek-V4、MiniMax M2.7、GLM-5.1等模型上的连续Day-0适配经验,已沉淀出一套可复用的优化方法。对AI算力市场而言,这释放了一个信号:国产GPU不再只是“可运行”,而是开始追求“与模型发布同步优化”,这有利于降低企业使用国产模型的门槛,尤其在政务、金融等对算力自主可控有强需求的场景中。

对用户/开发者/创作者的影响

对于AI应用开发者:如果使用MiniMax M3进行长文本理解、代码生成或多模态Agent开发,现在可以直接基于摩尔线程的MTT S5000进行推理部署,无需等待第三方适配,且能获得算子级性能优化。对于企业基础设施采购者:验证了国产GPU在主流开源推理框架(vLLM、SGLang)上的兼容性已经成熟,可作为一个国产算力选项进入评估。对于普通内容创作者或重度AI用户:虽然直接使用上感受不到硬件差异,但更快的模型部署意味着基于MiniMax M3的应用(如长文档问答、代码辅助工具)会更早出现在开放平台上。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

一是部署成本是否具竞争力:目前公开信息显示,MTT S5000的具体定价和与同算力英伟达GPU的性价比对比尚未公布,这是企业采购关注的核心。二是开发者生态的扩大速度:摩尔线程开放MUSA软件栈并与Triton社区对接,后续能否吸引更多模型开发者主动为其优化而非等待适配,将决定其生态厚度。三是MiniMax M3在其他国产GPU上的适配进度:华为云等也已宣布适配,后续不同国产硬件对同一模型的表现差异,会成为国产算力赛道的一个重要竞争维度。

来源:Readhub · AI

celebrityanime
celebrityanime
文章: 7294

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注