[Claude] 有大佬用上了 Claude Mythos Preview 吗？感觉挖洞是下一个被颠覆的工作了

一句话看懂：Anthropic 的 Claude Mythos Preview（代号 Mythos）宣称在 1000 多个开源项目中发现了超 2.3 万个漏洞，其中六成以上被第三方验证为高危或严重级别。但来自 Curl 项目维护者的实际测试表明，该模型发现的高危漏洞数量有限，且部分为误报，围绕 Mythos 的“颠覆性”仍有争议。

事件核心：发生了什么

2026 年 4 月，Anthropic 发布博文介绍其安全专用模型 Claude Mythos Preview，称在内部测试中利用该模型发现了 500 多个漏洞。5 月，Anthropic 更新进展，称扫描了 1000 多个开源项目，共识别出约 23,019 个潜在漏洞。其中，一家独立安全研究公司对 1,752 个高危或严重级别漏洞进行了评估，90.6%（1,587 个）被证实为有效，62.4%（1,094 个）被确认为高危或严重级别。Anthropic 表示，由于模型能力太强，在更完善的安全防护系统推出前不会公开发布，仅限受信任的合作伙伴使用。OpenAI 在 5 月也推出了同类产品“daybreak”，但尚未公布性能数据。

为什么重要

Mythos 的实际效果在社区中存在明显分歧。一方面，Cloudflare 在试用博文中指出，Mythos 能根据多个小漏洞构建利用链，其推理过程类似资深安全研究员而非传统扫描器。另一方面，Curl 项目维护者 Daniel Stenberg 亲自测试后表示，Mythos 自信报告了 5 个漏洞，经复查有 3 个为误报，1 个被认定为“bug 而非安全漏洞”，仅 1 个被判定为低危漏洞、分配了 CVE。Stenberg 认为，当前围绕 Mythos 的炒作更多是营销噱头，并未发现其相比已有工具有显著改进。此外，多位社区观察者指出，Mythos 可能更多依赖专为安全场景设计的测试框架（Harness）而非底层模型本身的进步。这一争议反映了 AI 安全工具的“实验室指标”与“实际项目效果”之间可能存在的鸿沟。

对用户/开发者/创作者的影响

对开源项目维护者而言，近期 oss-security 邮件列表中漏洞披露数量呈指数级上升，大量历史遗留代码正被 AI 扫描。这意味着未来几个月，许多维护者可能收到大量高误报率的漏洞报告，增加了审查负担。对开发者来说，将代码在提交前交给主流大模型进行安全审查可能成为新的默认工作流，尤其在 Web 服务开发等复杂度较高的场景中，Mythos 或 Opus 级别的模型已被部分开发者用于灰盒测试并发现了真实漏洞。对于企业安全团队，Mythos 等工具在配置错误和权限滥用检测方面尚未看到成熟方案，短期内不宜完全依赖 AI 替代人工审计。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，Anthropic 何时以及以何种形式公开发布 Mythos，是否会推出“阉割版”或通过 API 开放受限访问。第二，OpenAI 的 daybreak 产品若公布性能和准确率数据，将直接影响市场对 AI 安全工具实际能力的判断。第三，更多开源项目（如 Curl 之外的复杂 Web 系统）的独立复现结果将帮助厘清 Mythos 的真实能力边界，尤其是对利用链的自动化构建是否具有普遍适用性。

来源：V2EX (创意工作者社区)

[Claude] 有大佬用上了 Claude Mythos Preview 吗？感觉挖洞是下一个被颠覆的工作了