MiniMax发布M3 大模型:首创MSA架构并支持1M上下文,全面开源对标海外旗舰

MiniMax发布M3 大模型:首创MSA架构并支持1M上下文,全面开源对标海外旗舰

MiniMax发布M3 大模型:首创MSA架构并支持1M上下文,全面开源对标海外旗舰

一句话看懂:2026年6月1日,MiniMax正式开源新一代大模型M3,这是国内首个集成顶级编程、百万级超长上下文与原生多模态能力的大模型,旨在从技术上对标GPT-5.5和Gemini 3.1 Pro等海外闭源旗舰模型。

事件核心:发生了什么

MiniMax(稀宇科技)在6月1日正式推出并全面开源了其下一代大模型M3。该模型的核心创新在于自研的稀疏注意力架构(MSA),专门解决复杂智能体任务中的上下文扩展瓶颈。官方数据显示,MSA架构通过更精准的KV分区和算子级优化,在1M上下文长度下,每token计算成本仅为上一代模型的十分之一;Prefill阶段加速超过9倍,Decoding阶段加速15倍,整体计算速度是同类开源方案的4倍。在权威软件工程评测SWE-Bench Pro及多模态评估中,M3已超越GPT-5.5和Gemini 3.1 Pro。M3还展示了极端的自主任务能力:可在12小时内无代码复现ICLR顶会论文实验,或在24小时内连续调用工具近2000次,自主将Hopper架构上的FP8矩阵乘法硬件利用率从7.6%提升至71.3%,并完整完成“数据-训练-迭代”的自动化流程。

为什么重要

M3的开源策略直接冲击了闭源旗舰模型的市场。此前,支持百万级上下文并结合原生多模态、编程能力的开源模型极为稀缺,M3通过MSA架构大幅降低了超长上下文的计算成本(仅为原来的十分之一),这一技术路线可能改变业界对长上下文模型的商用成本预期。同时,M3通过原生万亿级交错数据的混合训练,实现了高度整合的语义空间,在SWE-Bench Pro等基准上超越GPT-5.5和Gemini 3.1 Pro,表明国产开源模型在核心能力层面已具备对标海外闭源产品的实力。这不仅加剧了大模型领域的“开源vs闭源”竞争,也为下游开发者提供了更底层的自主可控选择。

对用户/开发者/创作者的影响

对于开发者和技术团队,M3是全栈开源的,可直接部署并基于其MSA架构进行二次开发。超长上下文能力极大简化了处理大型项目代码库、长篇文档或复杂多模态任务的复杂度,且推理成本显著降低。对于AI应用创业者,M3的自主规划与工具调用能力(如自动调试模型、完成“数据-训练-迭代”全流程)意味着未来智能体可以承担更多重复性研发工作。对于普通用户和创作者,目前M3已作为开源模型提供,可以通过相关社区或API调用体验其多模态和编程能力,但具体消费级应用落地还需要时间。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

首先,M3的开源许可证和社区生态建设将直接影响其能否被广泛采用,值得跟踪其与Hugging Face、GitHub等平台的合作进度。其次,官网数据显示其性能超越GPT-5.5和Gemini 3.1 Pro,这些评测基于特定基准(如SWE-Bench Pro),在实际复杂业务场景中的通用性和稳定性仍有待第三方验证。最后,华为、百度等国内竞品及海外Meta的Llama系列是否会跟进类似MSA架构或提升上下文长度,将成为下一阶段大模型技术路线的重要看点。

来源:AIbase

celebrityanime
celebrityanime
文章: 4905

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注