
硅谷 CEO 深夜站台!MiniMax M3 冲上开源第一,中文社区却吵翻了?
一句话看懂:中国 AI 公司 MiniMax 发布了新一代开源大模型 M3,凭借超长上下文、原生多模态和 Agent 能力在全球开源模型中排名第一,但因同步调整 Token 定价策略引发部分老用户不满,社区出现分化讨论。
事件核心:发生了什么
MiniMax 于近期正式发布 M3 模型。该模型基于自研的 MiniMax Sparse Attention(MSA)稀疏注意力架构,实现了 100 万 token 的上下文窗口,在推理时每个 token 的计算量降至上一代的 1/20,预填充速度提升超过 9 倍,解码速度提升超过 15 倍。在第三方评测平台 Artificial Analysis 综合智能指数榜上,M3 拿下开源模型全球最高排名,位列全球第七;在 GPQA Diamond 科学推理榜上以 93.2% 达到全球第四,超越了 Claude Opus 4.8 和 Opus 4.7。Vercel 的 CEO Guillermo Rauch 公开在社交媒体上推荐该模型,引发海外开发者高度关注。不过,MiniMax 同步调整了 Token 价格策略,老用户认为自身权益显著缩水,在国内社区引发集中吐槽。MiniMax 官方当天即发出补偿方案,承诺老用户保留原有权益,新用户周限额加赠 50%。
为什么重要
M3 的意义在于它将中国开源模型首次推到了与闭源第一梯队直接竞争的位次。此前国内开源模型在大模型排行榜上大多只能与闭源模型的中腰部产品竞争,而 M3 在核心 benchmarks 上与 OpenAI GPT-5 系列和 Anthropic Opus 系列贴脸较量,差距明显缩小。同时,M3 的 MSA 架构在工程层面提供了一条解决百万级上下文推理成本爆炸的可行路径,把计算量压缩了近两个数量级,对长上下文应用的商业化落地有直接推动作用。M3 还一并推出了 Agent Team 系统,通过拆解任务、多 Worker 并行执行和 Verifier 自动验收的机制来提升复杂任务的完成质量,这在开源模型生态中是相对少见的量产级 Agent 工程实践。
对用户/开发者/创作者的影响
开发者和 AI 应用构建者将直接受益于 M3 的开源模式。权重和技术报告将在十天内全面开源,意味着团队可自行部署、微调和审查安全边界,不用完全依赖 API。实测显示,M3 用 1/5 的 Token 成本完成了 Claude Sonnet 能做的 Agent 编程任务,对预算敏感的创业团队吸引力显著。内容创作者和研究人员可以利用其 100 万上下文处理长文档和长视频。实测中,M3 能够独立解析 50 页的 DeepSeek-V3 技术报告并梳理出完整技术链条,以及从 1.15GB 的 2 小时 GTC 演讲视频中提取时间戳、关键画面和演讲者主动判断的亮点并撰写出 3500 字的初稿。普通用户需要留意:价格调整风波虽已通过补偿方案暂时平息,但现有 API 定价是否稳定仍有不确定性;同时,模型能力虽强,但在复杂真实场景(如密集型科学问答、Agent 自主决策链)中仍有犯错可能,海外开发者已呼吁社区进行更多独立复现测试。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
首先,开源权重发布后,全球开发者能否在真实项目上复现甚至超越官方宣传的 benchmark 成绩,是决定 M3 是否真正「站住」的关键可信度检验。其次,MiniMax 在 Agent Team 方面的工程能力是否能够持续迭代并向开源社区贡献,将影响它能否在 OpenAI、Anthropic 的生态之外建立自己的开发者忠诚度。第三,价格策略的短期调整只是在补偿老用户,如果后续不形成透明、稳定的 API 定价体系,仍可能制约海外企业客户的长线采纳。目前公开信息显示,MiniMax 已在多个维度将 M3 推到开源模型的全球最前沿,但接下来两周的开源技术报告和权重开放,才是决定其能否真正跨越“刷榜”和“落地”之间鸿沟的转折点。
来源:Readhub · AI
![[程序员] 写 README/技术方案时被 Ai 生成的 PlantUml/Mermaid 折腾烦了,做了个 预览小工具](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_5-245-768x403.jpg)

