Day-0 支持，摩尔线程完成 MiniMax M3 大模型适配

一句话看懂：6月12日，MiniMax开源旗舰多模态模型M3，摩尔线程在同日完成适配，其MTT S5000智算卡已能为M3提供从训练到推理的全链路算力支持。这意味着国产大模型在国产GPU上的部署速度正在追上国际节奏。

事件核心：发生了什么

6月12日，MiniMax发布并开源了新一代原生多模态模型M3，拥有百万token级超长上下文窗口，并强化了代码生成和智能体（Agent）能力。同一天，摩尔线程宣布其训推一体智算卡MTT S5000已实现对该模型的Day-0适配。具体优化包括：利用硬件级FP8加速（单卡稠密算力1000 TFLOPS）和80GB显存、1.6TB/s带宽来支撑超长序列的KV Cache存储；通过MUSA C++与Triton-MUSA抽象层快速迁移新算子；并在vLLM和SGLang两大主流推理框架上同步拉起，以开源生态提供部署选择。

为什么重要

这次适配打破了以往“模型发布后需数周甚至数月才能适配国产硬件”的惯例，首次实现了国产模型与国产GPU在开源当天的同步适配。从技术路径看，摩尔线程通过此前在DeepSeek-V4、MiniMax M2.7、GLM-5.1等模型上的连续Day-0适配经验，已沉淀出一套可复用的优化方法。对AI算力市场而言，这释放了一个信号：国产GPU不再只是“可运行”，而是开始追求“与模型发布同步优化”，这有利于降低企业使用国产模型的门槛，尤其在政务、金融等对算力自主可控有强需求的场景中。

对用户/开发者/创作者的影响

对于AI应用开发者：如果使用MiniMax M3进行长文本理解、代码生成或多模态Agent开发，现在可以直接基于摩尔线程的MTT S5000进行推理部署，无需等待第三方适配，且能获得算子级性能优化。对于企业基础设施采购者：验证了国产GPU在主流开源推理框架（vLLM、SGLang）上的兼容性已经成熟，可作为一个国产算力选项进入评估。对于普通内容创作者或重度AI用户：虽然直接使用上感受不到硬件差异，但更快的模型部署意味着基于MiniMax M3的应用（如长文档问答、代码辅助工具）会更早出现在开放平台上。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

一是部署成本是否具竞争力：目前公开信息显示，MTT S5000的具体定价和与同算力英伟达GPU的性价比对比尚未公布，这是企业采购关注的核心。二是开发者生态的扩大速度：摩尔线程开放MUSA软件栈并与Triton社区对接，后续能否吸引更多模型开发者主动为其优化而非等待适配，将决定其生态厚度。三是MiniMax M3在其他国产GPU上的适配进度：华为云等也已宣布适配，后续不同国产硬件对同一模型的表现差异，会成为国产算力赛道的一个重要竞争维度。

来源：Readhub · AI

Day-0 支持，摩尔线程完成 MiniMax M3 大模型适配

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

Show HN：我花了两年时间开发新浏览器，今天它通过了 Acid 3 测试

Sensor Tower: India’s mobile app market generated a record $345M in consumer spending in Q2, up 35% YoY; ChatGPT ranked No. 1 by downloads and No. 2 by revenue (Jagmeet Singh/TechCrunch)

Flint：AI时代的可视化语言

发表回复取消回复