M3与Opus代码审计13个bug：$0.07 vs $1.30

一句话看懂：MiniMax 在社交媒体上公布了一项对比测试：其自研模型 M3 与 Anthropic 的 Opus 模型对同一份代码进行审计，M3 以约 0.07 美元的成本发现了 13 个 bug，而 Opus 成本约 1.30 美元，揭示了不同模型在代码审计任务上的能力与成本差异。

事件核心：发生了什么

MiniMax 的官方 X 账号发布了一份实测对比报告。测试内容是让两款大语言模型——MiniMax 自研的 M3 模型与 Anthropic 的 Opus 模型——对一段代码执行安全审计。结果显示：M3 模型共发现 13 个代码缺陷，Opus 未披露具体发现数量，但 MiniMax 强调 M3 的成本仅为 Opus 的约 1/18。目前公开信息显示，MiniMax 并未同时公布 Opus 的具体发现数量，也未说明代码样本的来源或复杂度。该测试由 MiniMax 单方面完成，尚未获得第三方独立验证。

为什么重要

这次测试直接对比了国产自研模型与海外主流闭源模型在特定任务上的实用成本。代码审计通常对模型的推理能力和上下文理解提出较高要求，也是一个典型的商业化场景。如果 M3 在成本上具有显著优势且审计结果可靠，意味着在软件安全检测、代码合规审查等企业级应用场景中，开发者可能获得更经济的替代方案。这一对比也间接回应了行业内关于“国产模型是否只能在简单对话中胜任”的质疑，但需要注意的是，一次测试的样本量有限，不能直接推及所有场景。此外，MiniMax 选择在 X 平台上以短视频或图文形式发布，传递低成本、可信任的模型印象，本身也是其市场策略的一部分。

对用户/开发者/创作者的影响

对于从事软件安全、DevOps 或持续集成的开发者与团队，如果 M3 模型的 API 能够稳定提供与 Opus 相似或更优质量的代码审计能力，那么每月云服务账单可能大幅下降——从每次任务 1.3 美元降至 7 美分。由于代码审计常需高频反复调用，成本优势的累积效应十分明显。该测试也鼓励模型使用者不盲信品牌，而是基于具体任务（如代码审计、逻辑推理或文档生成）选择最合适的模型，甚至探索多模型组合使用。但对于依赖 Opus 的高安全性应用（如医疗、金融代码审计），在独立第三方审计完成之前，切换模型仍需谨慎评估风险。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

1. 独立第三方复现测试：M3 是否能稳定复现其代码审计能力，需要更多开发团队在实际项目中验证。2. MiniMax API 定价调整：如果 M3 在代码审计场景被大量使用，其 API 定价是否保持稳定或进一步下降，将直接影响开发者生态。3. Anthropic 的回应：Anthropic 是否会对这批测试数据做出回应，或者推出 Opus 的新版本以强化代码审计能力，将是后续竞争的关键看点。

来源：X：MiniMax (@MiniMax_AI)

M3与Opus代码审计13个bug：$0.07 vs $1.30