
一句话看懂:稀宇科技(MiniMax)正式开源其原生多模态旗舰模型 MiniMax M3,该模型在推出后两周内登顶全球综合智能指数开源模型榜首,输出速度已从 30 TPS 提升至 80 TPS,成为国产多模态大模型开源进程中的重要节点。
事件核心:发生了什么
MiniMax 于今日宣布开源其旗舰级多模态模型 M3。该模型总参数量达 428B,激活参数为 23B,且是业内首个从训练初期即采用多模态混合训练的开源大模型。MiniMax 此前已提前开放模型权重,并同步发布了稀疏注意力机制相关论文。得益于技术架构优势,M3 在发布两周内即在全球综合智能指数排行榜上获得开源模型第一名。针对初期访问量激增带来的延迟问题,官方已将输出速度从 30 TPS 优化至 80 TPS,并计划继续提速。在编码与智能体能力评测中,M3 也展现出自主拆解任务、调用外部工具进行多步推理的能力,其输出的代码目标为“直接可交付”级别。
为什么重要
M3 的开源标志着国产多模态大模型在工程化与学术研究两个维度进入新阶段。首先,它验证了“从零多模态训练”而非后期拼接的技术路线在大规模开源模型中的可行性,为行业提供了新的模型训练范式参考。其次,稀疏注意力机制的公开有助于降低推理所需算力,间接推动了开源模型的产业化落地。此外,M3 以领先速度登顶开源模型排行榜,意味着国产模型在综合性能上已具备与国际同类开源项目竞争的实力,有助于吸引更多开发者和企业用户进入国产AI生态。
对用户/开发者/创作者的影响
对于开发者而言,M3 的开源提供了可直接调用的重量级基础模型,其代码交付能力可显著减少后期人工修复工作,提升开发效率;稀疏注意力机制也让本地部署或私有化部署的成本有望降低。对于创作者和普通用户,如果使用基于 M3 构建的应用,将享受到更快的推理速度和更稳定的多模态交互体验。目前公开信息显示,M3 已能处理复杂的多步推理任务,这对需要结合图像、文本、工具调用等多模态能力的AI应用场景,如智能助手、自动化客服、内容生成工具等,具有实际商业价值。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,M3 后续是否会推出针对特定行业(如金融、医疗)的精调版本或API服务,以及定价策略如何,将直接影响其商业化进程。第二,开源社区是否会围绕 M3 形成活跃的微调、优化及应用开发生态,这是衡量其长期影响力的关键指标。第三,其他国产大模型厂商(如智谱、百川、阿里等)是否会加速开放更强规格的多模态开源模型,可能引发新一轮模型竞争。第四,随着输出速度进一步提升至 100 TPS 以上,M3 在实时交互场景中的可用性将大幅增强,需观察其在智能硬件或边缘设备上的适配进展。
来源:Readhub · AI


