MiniMax发布M3 大模型：首创MSA架构并支持1M上下文，全面开源对标海外旗舰

一句话看懂：2026年6月1日，MiniMax正式开源新一代大模型M3，这是国内首个集成顶级编程、百万级超长上下文与原生多模态能力的大模型，旨在从技术上对标GPT-5.5和Gemini 3.1 Pro等海外闭源旗舰模型。

事件核心：发生了什么

MiniMax（稀宇科技）在6月1日正式推出并全面开源了其下一代大模型M3。该模型的核心创新在于自研的稀疏注意力架构（MSA），专门解决复杂智能体任务中的上下文扩展瓶颈。官方数据显示，MSA架构通过更精准的KV分区和算子级优化，在1M上下文长度下，每token计算成本仅为上一代模型的十分之一；Prefill阶段加速超过9倍，Decoding阶段加速15倍，整体计算速度是同类开源方案的4倍。在权威软件工程评测SWE-Bench Pro及多模态评估中，M3已超越GPT-5.5和Gemini 3.1 Pro。M3还展示了极端的自主任务能力：可在12小时内无代码复现ICLR顶会论文实验，或在24小时内连续调用工具近2000次，自主将Hopper架构上的FP8矩阵乘法硬件利用率从7.6%提升至71.3%，并完整完成“数据-训练-迭代”的自动化流程。

为什么重要

M3的开源策略直接冲击了闭源旗舰模型的市场。此前，支持百万级上下文并结合原生多模态、编程能力的开源模型极为稀缺，M3通过MSA架构大幅降低了超长上下文的计算成本（仅为原来的十分之一），这一技术路线可能改变业界对长上下文模型的商用成本预期。同时，M3通过原生万亿级交错数据的混合训练，实现了高度整合的语义空间，在SWE-Bench Pro等基准上超越GPT-5.5和Gemini 3.1 Pro，表明国产开源模型在核心能力层面已具备对标海外闭源产品的实力。这不仅加剧了大模型领域的“开源vs闭源”竞争，也为下游开发者提供了更底层的自主可控选择。

对用户/开发者/创作者的影响

对于开发者和技术团队，M3是全栈开源的，可直接部署并基于其MSA架构进行二次开发。超长上下文能力极大简化了处理大型项目代码库、长篇文档或复杂多模态任务的复杂度，且推理成本显著降低。对于AI应用创业者，M3的自主规划与工具调用能力（如自动调试模型、完成“数据-训练-迭代”全流程）意味着未来智能体可以承担更多重复性研发工作。对于普通用户和创作者，目前M3已作为开源模型提供，可以通过相关社区或API调用体验其多模态和编程能力，但具体消费级应用落地还需要时间。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

首先，M3的开源许可证和社区生态建设将直接影响其能否被广泛采用，值得跟踪其与Hugging Face、GitHub等平台的合作进度。其次，官网数据显示其性能超越GPT-5.5和Gemini 3.1 Pro，这些评测基于特定基准（如SWE-Bench Pro），在实际复杂业务场景中的通用性和稳定性仍有待第三方验证。最后，华为、百度等国内竞品及海外Meta的Llama系列是否会跟进类似MSA架构或提升上下文长度，将成为下一阶段大模型技术路线的重要看点。

来源：AIbase

MiniMax发布M3 大模型：首创MSA架构并支持1M上下文，全面开源对标海外旗舰