
271 个漏洞“几乎零误报”:Mozilla 用 AI 代理给代码安全上了一课
当上个月 Mozilla 的 CTO 高调宣称“零日漏洞已时日无多”时,业界普遍报以怀疑。人们早已习惯了 AI 安全宣传中“挑选几个亮眼案例、隐藏失败细节、让炒作列车继续运行”的模式。但就在本周四,Mozilla 罕见地公开了其使用 Anthropic Mythos 模型在两个月内发现 271 个 Firefox 安全漏洞的全过程,并给出了一个令质疑者难以反驳的结论:“几乎没有误报”。这不再是简单的概念验证,而是一次真正改变了代码安全“人机协作”范式的实践。
告别“AI 生成的废话”:定制化 Harness 是关键
Mozilla 杰出工程师 Brian Grinstead 坦言,早期尝试 AI 辅助漏洞检测时充斥着“不想要的垃圾”。模型能生成看似合理的漏洞报告,但经开发者核实,大量细节都是 AI 幻觉。修复这些虚假报告的时间成本甚至比人工排查更高。
Mythos 之所以不同,核心在于 Mozilla 团队构建的一个定制化 Agent Harness(代理工具箱)。Grinstead 解释道:“这个 Harness 驱动大模型去达成目标——给它指令(如‘在这个文件里找 bug’)、提供工具(读写文件、运行测试用例),然后让它循环工作直到完成。”这套系统赋予了 Mythos 与 Mozilla 人类开发者完全相同的权限和工具,包括专门的带 sanitizer 的 Firefox 测试构建版本。当模型怀疑某处存在内存安全问题,它会像人类工程师一样构造测试用例,调用现有的模糊测试工具,并得到是/否的明确答案。
双重验证机制:从“可能性”到“确定性”
Mozilla 并未完全信任单一模型的判断。他们引入了一个第二 LLM 作为“评审”,对主模型产出的结果进行评分。只有得分足够高的漏洞报告,才会被提交给开发者。这种双重验证机制,让开发者拥有了与查看传统方法生成报告时同等的信心。
Grinstead 表示:“这是解锁我们规模化运作能力的关键。它给了工程师一个可以信任的‘曲柄’——拉一下就知道:‘没错,这里确实有问题。’然后你就能迭代代码,明确知道何时修复,最终将测试用例入库,防止回归。”Mozilla 已经全面公开了其中 12 个漏洞的 Bugzilla 报告,包括触发不安全内存条件的 HTML 等测试用例,证明这些发现完全符合 Mozilla 认定安全漏洞的严格标准。
我的看法:安全攻防进入“代理化”时代
Mozilla 这次实践的真正突破点,不在于 AI 模型本身,而在于 “代理框架”——通过一个衔接层,将大模型的推理能力与已有的、成熟的开发者工具链无缝整合。这种做法将 AI 从一个“给出模糊建议的聊天机器人”升级为“一个能自主编写、测试、验证代码问题的初级工程师”。
值得注意的是,Mozilla 并没有给这 271 个漏洞申请 CVE 编号,这曾引发部分观察者的嘲讽。但这种选择恰恰反映了他们的务实态度:这些漏洞更多是内部质量改进的成果,而非面向外界公开的里程碑。随着 Mozilla 将这一经验推广到更多项目,AI 辅助漏洞检测正从“噱头”走向“基础设施”。对于整个行业而言,真正的启示是:下一个时代的安全竞争力,将不再取决于你拥有多好的 AI 模型,而在于你能否为这些模型打造出最高效、最可靠的“代理手柄”。


