Mozilla 表示，Mythos 发现的 271 个漏洞“几乎没有误报”-9acd41

271 个漏洞“几乎零误报”：Mozilla 用 AI 代理给代码安全上了一课

当上个月 Mozilla 的 CTO 高调宣称“零日漏洞已时日无多”时，业界普遍报以怀疑。人们早已习惯了 AI 安全宣传中“挑选几个亮眼案例、隐藏失败细节、让炒作列车继续运行”的模式。但就在本周四，Mozilla 罕见地公开了其使用 Anthropic Mythos 模型在两个月内发现 271 个 Firefox 安全漏洞的全过程，并给出了一个令质疑者难以反驳的结论：“几乎没有误报”。这不再是简单的概念验证，而是一次真正改变了代码安全“人机协作”范式的实践。

告别“AI 生成的废话”：定制化 Harness 是关键

Mozilla 杰出工程师 Brian Grinstead 坦言，早期尝试 AI 辅助漏洞检测时充斥着“不想要的垃圾”。模型能生成看似合理的漏洞报告，但经开发者核实，大量细节都是 AI 幻觉。修复这些虚假报告的时间成本甚至比人工排查更高。

Mythos 之所以不同，核心在于 Mozilla 团队构建的一个定制化 Agent Harness（代理工具箱）。Grinstead 解释道：“这个 Harness 驱动大模型去达成目标——给它指令（如‘在这个文件里找 bug’）、提供工具（读写文件、运行测试用例），然后让它循环工作直到完成。”这套系统赋予了 Mythos 与 Mozilla 人类开发者完全相同的权限和工具，包括专门的带 sanitizer 的 Firefox 测试构建版本。当模型怀疑某处存在内存安全问题，它会像人类工程师一样构造测试用例，调用现有的模糊测试工具，并得到是/否的明确答案。

双重验证机制：从“可能性”到“确定性”

Mozilla 并未完全信任单一模型的判断。他们引入了一个第二 LLM 作为“评审”，对主模型产出的结果进行评分。只有得分足够高的漏洞报告，才会被提交给开发者。这种双重验证机制，让开发者拥有了与查看传统方法生成报告时同等的信心。

Grinstead 表示：“这是解锁我们规模化运作能力的关键。它给了工程师一个可以信任的‘曲柄’——拉一下就知道：‘没错，这里确实有问题。’然后你就能迭代代码，明确知道何时修复，最终将测试用例入库，防止回归。”Mozilla 已经全面公开了其中 12 个漏洞的 Bugzilla 报告，包括触发不安全内存条件的 HTML 等测试用例，证明这些发现完全符合 Mozilla 认定安全漏洞的严格标准。

我的看法：安全攻防进入“代理化”时代

Mozilla 这次实践的真正突破点，不在于 AI 模型本身，而在于 “代理框架”——通过一个衔接层，将大模型的推理能力与已有的、成熟的开发者工具链无缝整合。这种做法将 AI 从一个“给出模糊建议的聊天机器人”升级为“一个能自主编写、测试、验证代码问题的初级工程师”。

值得注意的是，Mozilla 并没有给这 271 个漏洞申请 CVE 编号，这曾引发部分观察者的嘲讽。但这种选择恰恰反映了他们的务实态度：这些漏洞更多是内部质量改进的成果，而非面向外界公开的里程碑。随着 Mozilla 将这一经验推广到更多项目，AI 辅助漏洞检测正从“噱头”走向“基础设施”。对于整个行业而言，真正的启示是：下一个时代的安全竞争力，将不再取决于你拥有多好的 AI 模型，而在于你能否为这些模型打造出最高效、最可靠的“代理手柄”。

Mozilla 表示，Mythos 发现的 271 个漏洞“几乎没有误报”-9acd41

271 个漏洞“几乎零误报”：Mozilla 用 AI 代理给代码安全上了一课

告别“AI 生成的废话”：定制化 Harness 是关键

双重验证机制：从“可能性”到“确定性”

我的看法：安全攻防进入“代理化”时代

celebrityanime

发表回复取消回复

271 个漏洞“几乎零误报”：Mozilla 用 AI 代理给代码安全上了一课

告别“AI 生成的废话”：定制化 Harness 是关键

双重验证机制：从“可能性”到“确定性”

我的看法：安全攻防进入“代理化”时代

celebrityanime

相关文章

马斯克官宣 SpaceX 太空 AI 算力项目 Starmind 规划 100 万颗卫星入轨

终于要变聪明了！特斯拉官宣接入豆包 — 快科技 — 科技改变未来

宁泉资产：本次 AI 泡沫已属于超大型泡沫，堪比世纪之交的互联网泡沫

发表回复取消回复