
超越GPT-5.5!国产AI大模型MiniMax M3 正式发布
一句话看懂:6月1日,稀宇科技(Xiyu Technology)发布新一代大模型MiniMax M3,在编程能力、百万级超长上下文和原生多模态能力上表现突出,其中SWE-Bench Pro跑分超越GPT-5.5和Gemini 3.1 Pro,成为国内首个将编程、多模态与桌面操作三合一的开源模型。
事件核心:发生了什么
MiniMax M3 是稀宇科技最新发布的大语言模型。其最核心的突破有三点:第一,在权威编程评测集SWE-Bench Pro上得分59.0%,超过GPT-5.5和Gemini 3.1 Pro,仅次于Opus 4.7;第二,支持高达100万token的超长上下文;第三,原生支持图像、视频输入以及计算机桌面操作,属于业内首个将编程、多模态和Agent操作打包开源的中国模型。在Claw-Eval(AI Agent评测)和OmniDocBench(多模态文档理解)两项测试中也取得了领先分数。技术层面,M3采用了新的稀疏注意力架构(MSA),在百万级token极端场景下,单token计算量仅为上一代模型的一半,理解阶段速度提升超过9倍,生成阶段速度提升超过15倍。目前API已经开放,官方承诺将在10天内开源模型权重和技术报告。
为什么重要
MiniMax M3 的出现有双重意义。首先,在硬核编程评测上超过GPT-5.5,说明国产大模型在代码生成这一关键能力上已经追平甚至局部超越海外顶级模型,这对于企业级软件开发和AI辅助编程工具的国产替代具有直接影响。其次,M3将编程、多模态理解和桌面Agent操作集成到一个开源模型中,降低了开发者构建复杂AI应用的门槛。稀疏注意力架构的落地也证明了在超长上下文场景下降低推理成本的可行路径,这对整个大模型行业的算力优化方向具有参考价值。
对用户/开发者/创作者的影响
对开发者而言,M3开源的模型权重和技术报告意味着可以在本地部署并进行微调,适合有数据隐私要求的金融、医疗、政务等垂直行业。API已可用,可以快速接入现有应用。对创作者来说,原生多模态能力支持图像和视频输入,可用来做文档理解、内容摘要等任务,省去多模型串联的麻烦。对普通用户,如果有长文档处理(如法律合同、科研论文)或复杂编程需求,M3在速度和上下文支持方面会带来实际体验提升。桌面操作功能则可能催生新一代自动化办公工具。不过目前尚需等待正式开源后才能判断其部署成本和实际效果。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,开源后的社区反馈与第三方复现结果:M3的实际推理速度、硬件需求是否如官方声称那样高效,需要独立验证。第二,API定价与竞品对比:M3的API上线后价格是否具备竞争力,将直接影响其商业化进度。第三,超长上下文的实际应用场景:100万token能力能否在真实业务中被充分使用,例如法律审查或科研检索,需要具体案例验证。此外,桌面操作功能的准确性和安全性也是监管和用户关注的焦点。
来源:AIbase


