
一句话看懂:MiniMax 于 2026 年 6 月 12 日发布了其最新旗舰模型 M3 的开源权重版本,总参数量约 428B,激活参数约 23B,模型权重已上架 HuggingFace。这是首个在编码与智能体能力、稀疏注意力长上下文以及开源权重这三个前沿方向同时达到行业顶尖水平的模型。
事件核心:发生了什么
MiniMax 官方在 X 平台宣布推出 MiniMax M3 的开源权重版本。该模型总参数量约为 4280 亿(~428B),但通过稀疏激活技术,每次推理仅激活约 230 亿(~23B)参数,兼顾了高性能与较低的推理成本。模型权重已上传至 HuggingFace 仓库(huggingface.co/MiniMaxAI/MiniMax-M3),开发者可下载使用。同时,MiniMax 发布了配套的稀疏注意力技术论文(huggingface.co/papers/2606.13…),解释如何将模型上下文窗口扩展到 100 万 tokens(1M)。在性能方面,M3 在 SWE-Bench Pro 的代码和智能体任务中取得了 59.0% 的得分,在 Terminal Bench 2.1 上达到 66.0%,在 KernelBench Hard 上达到 28.8%,并支持 MCP Atlas 以获得 74.2% 的分数。
为什么重要
M3 的开源权重发布在 AI 模型生态中具有多重意义。首先,它打破了“开源模型在代码和智能体能力上落后闭源模型”的惯常认知,用 SWE-Bench Pro 等现实世界复杂任务的高分证明开源级别已达到商业可用水平。其次,MiniMax Sparse Attention 技术将长上下文从数十万 tokens 提升至 1M 级别,且以稀疏而非全注意力方式实现,显著降低了长序列推理时的算力开销。最后,~428B 总量、~23B 激活参数的设计路径,为其他团队提供了一条“用 MoE 思路但更激进稀疏化”的可行路线,可能加速开源社区在超大模型低成本部署上的探索。
对用户/开发者/创作者的影响
对于开发者,权重开源意味着可以自由下载、微调、私有部署 M3,不必依赖封闭 API,这对于金融、医疗、法律等数据敏感行业尤为关键。对于创作者和智能体开发者,1M 上下文窗口可直接处理整部书籍、完整代码仓库或长时间对话日志,而无需分段或做复杂检索增强(RAG)。对于企业 IT 采购方,激活仅 23B 参数的实际推理开销,意味着相比同等能力的闭源模型(如 GPT-4 级别模型),运行 M3 可能大幅降低 GPU 硬件和电费成本,但具体性能与稳定性的对比仍需实际部署测试。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,M3 的权重授权协议尚未详细公开,需注意是否包含商用限制、衍生产品需开源等常见附加条件。第二,开源社区是否会出现基于 M3 的微调版本或 LoRA 适配器,并形成类似 Llama 或 Qwen 那样的生态链条,将直接影响该模型的长期影响力。第三,长上下文的实际推理速度和显存占用是否如 MiniMax 官方声称的那样高效,尚待第三方基准测试复现,开发者应关注 HuggingFace 仓库中的 issue 和社区讨论以获取一手经验。


