编程力压GPT-5.5!MiniMax发布新一代M3 大模型,三大硬核能力全球唯一开源

编程力压GPT-5.5!MiniMax发布新一代M3 大模型,三大硬核能力全球唯一开源

编程力压GPT-5.5!MiniMax发布新一代M3 大模型,三大硬核能力全球唯一开源

一句话看懂:6月1日,MiniMax(西云科技)正式发布新一代大语言模型M3,在编程、超长上下文和多模态三大指标上同时达到行业顶尖水平,并承诺未来10天内完全开源。这是目前全球唯一一款同时具备这三项能力并选择开源的模型。

事件核心:发生了什么

MiniMax M3在多个权威评测中表现突出。在编程测试SWE-Bench Pro上,M3取得59.0%的准确率,超越GPT-5.5和Gemini 3.1 Pro,逼近Claude 3.5 Opus(对应原文Opus 4.7)。在AI智能体调度测试Claw-Eval和多模态文档解析测试OmniDocBench中,M3均获得行业最高分或超过Gemini 3.1 Pro。

M3支持最高100万tokens的超长上下文窗口,并在结构上做出关键创新:采用新的稀疏注意力架构MSA(MiniMax Sparse Attention)。在处理百万token长文本时,每个Token的计算成本降至上一代模型的十分之一,Prefilling(预填充)阶段运行速度快9倍以上,Decoding(解码生成)阶段加速超过15倍。

作为原生多模态模型,M3可输入文本、图像和视频,甚至能直接执行计算机桌面级自动化操作。同时,MiniMax还发布了升级后的编程助手MiniMax Code,并为开发者推出新的Token订阅方案:Plus(49元/月)、Max(119元/月)和Ultra(469元/月)。目前M3的API接口已对外开放,512k版本提供限时7天五折优惠。

为什么重要

M3的发布标志着中国大模型厂商在编程、超长上下文和多模态这三个最核心的技术指标上,首次同时达到世界级水平,并且在开源策略上选择了“全权重+技术报告”的开放路线。这直接冲击了当前以闭源模型为主的竞争格局:此前,这些能力通常分散在不同的闭源模型中,且开源模型多在其中一两个维度上追赶。MiniMax选择一次性全部开放,可能加速全球开发者生态在边缘计算和应用层的创新。

从算力成本角度看,MSA稀疏注意力架构带来的十倍以上的推理加速,意味着同等算力下可以服务更多用户,或者更低的API定价,这对中小企业和对成本敏感的开发场景具有实际意义。

对用户/开发者/创作者的影响

开发者:最直接的影响是API已可用,且短期内价格有优惠。超长上下文(1M token)和编程能力的提升,意味着可以处理更大规模的代码库、文档或对话历史,减少分段处理带来的性能损耗。开源后,开发者还可以基于完整权重进行微调或本地部署,这对隐私敏感场景(如金融、医疗)尤为重要。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

创作者:多模态能力的加入(图像、视频输入)和桌面自动化操作,使得M3可用于自动处理截图、视频帧分析、多步骤工作流编排等场景,而不只是纯文本对话。

普通用户:短期内影响有限,但MiniMax Code升级和Token订阅方案的推出,可能会吸引更多AI辅助编程用户。长远来看,开源和低成本推理会催生更多AI应用落地。

值得关注的后续

  1. 开源兑现与生态反馈:官方承诺10天内完全开源,届时社区能否快速移植、微调并集成到现有工具链中,是衡量此次开源含金量的关键。
  2. 竞品跟进:GPT-5.5和Gemini 3.1 Pro已明确在编程测试中被超越,后续OpenAI和Google是否会调整策略或加速更新?国内其他大模型厂商(如深度求索、月之暗面、智谱等)是否会在同等技术路线或开源策略上做出反应?
  3. 商业化落地:499元/月的Ultra订阅是否能被高端开发者或企业接受?限时优惠能否在短期内拉高API调用量,形成生态黏性?这些将直接验证M3的技术价值能否转化为商业回报。

来源:AIbase

celebrityanime
celebrityanime
文章: 4940

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注