最强黑客大模型，不再是Mythos

一句话看懂：微软用一套调度100多个专业Agent的多模型安全系统MDASH，在AI漏洞发现顶级基准测试CyberGym上以88.45%的成绩超越Anthropic的Mythos（83.1%）和OpenAI的GPT-5.5（81.8%）。关键在于微软自己没有顶尖前沿模型，而是靠工程系统拿下了第一名。

事件核心：发生了什么

5月12日，微软发布代号MDASH的AI安全系统，在UC Berkeley团队开发的CyberGym基准测试（ICLR 2026论文）上登顶。该测试包含1507道题目，来自188个真实开源项目，要求AI根据已知漏洞代码和描述自行写出可触发漏洞的攻击代码。微软在博客中明确表示，MDASH使用的全部是市面上公开可用的模型，而非自研前沿模型。这套系统通过“准备→扫描→验证→去重→证明”五个阶段，将重度推理交予大模型、高频验证使用蒸馏小模型，审计Agent与辩论Agent分开运作。目前已辅助发现Windows 11系统的16个高危漏洞，其中4个为无需认证即可远程触发的关键级别远程代码执行漏洞，已在5月Patch Tuesday中修复。内部回溯测试显示，MDASH对Windows核心组件clfs.sys过去五年已知漏洞的召回率达96%，tcpip.sys达100%。

为什么重要

MDASH证明了“围绕模型构建系统”可以与“训练更强模型”在特定领域正面竞争。Anthropic的Mythos因能力过强而限制发布，仅通过Project Glasswing定向开放；OpenAI的GPT-5.5也是倾全公司之力训出的前沿模型。微软没有这些资源，却通过工程手段消解了它们的模型优势——而且用的正是对手的模型。这对AI安全竞赛格局形成直接冲击：模型公司（Anthropic、OpenAI）的领先优势不能自动转化为应用层优势，平台公司（微软、谷歌）可以走“没有最强模型，但构建最强系统”的差异化路径。MDASH底层模型的复用性也使得新模型出来后只需A/B测试即可无缝接入，前期工程资产可全部复用。

对用户/开发者/创作者的影响

对普通用户，最直接的影响是补丁规模将越来越大——微软已明确表示以后的Patch Tuesday会更大，因为AI加速了漏洞发现速度。用户需及时安装系统更新，否则连不懂技术的人也能借助AI利用这类漏洞。对安全开发者，MDASH展示了多Agent系统在专业审计领域的工程实践方向：准备、扫描、验证、去重、证明五个阶段的拆解思路，以及模型之间分歧转化为信号的方法论，具有参考价值。对AI应用开发者，MDASH的“系统>模型”启示意味着在垂直场景中，工程化的Agent调度能力可能比一味追求最强基础模型更具性价比。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，微软尚未公布MDASH的定价和正式发布时间，目前正像Mythos和GPT-5.5 Cyber一样进行小范围客户私测，产品商用化节奏值得留意。第二，MDASH团队多位核心成员来自DARPA AI网络挑战赛优胜队伍Team Atlanta，验证过“工程量远超模型本身”这一判断，未来可能将系统能力扩展到Windows之外的更多平台和软件。第三，攻击者同样能使用公开可用的模型复现类似能力，AI安全攻防的军备竞赛节奏将显著加快，监管和行业标准是否会因此调整值得跟踪。

来源：36氪 · 24小时热榜

最强黑客大模型，不再是Mythos