最强黑客大模型,不再是Mythos

最强黑客大模型,不再是Mythos

最强黑客大模型,不再是Mythos

一句话看懂:微软用一套调度100多个专业Agent的多模型安全系统MDASH,在AI漏洞发现顶级基准测试CyberGym上以88.45%的成绩超越Anthropic的Mythos(83.1%)和OpenAI的GPT-5.5(81.8%)。关键在于微软自己没有顶尖前沿模型,而是靠工程系统拿下了第一名。

事件核心:发生了什么

5月12日,微软发布代号MDASH的AI安全系统,在UC Berkeley团队开发的CyberGym基准测试(ICLR 2026论文)上登顶。该测试包含1507道题目,来自188个真实开源项目,要求AI根据已知漏洞代码和描述自行写出可触发漏洞的攻击代码。微软在博客中明确表示,MDASH使用的全部是市面上公开可用的模型,而非自研前沿模型。这套系统通过“准备→扫描→验证→去重→证明”五个阶段,将重度推理交予大模型、高频验证使用蒸馏小模型,审计Agent与辩论Agent分开运作。目前已辅助发现Windows 11系统的16个高危漏洞,其中4个为无需认证即可远程触发的关键级别远程代码执行漏洞,已在5月Patch Tuesday中修复。内部回溯测试显示,MDASH对Windows核心组件clfs.sys过去五年已知漏洞的召回率达96%,tcpip.sys达100%。

为什么重要

MDASH证明了“围绕模型构建系统”可以与“训练更强模型”在特定领域正面竞争。Anthropic的Mythos因能力过强而限制发布,仅通过Project Glasswing定向开放;OpenAI的GPT-5.5也是倾全公司之力训出的前沿模型。微软没有这些资源,却通过工程手段消解了它们的模型优势——而且用的正是对手的模型。这对AI安全竞赛格局形成直接冲击:模型公司(Anthropic、OpenAI)的领先优势不能自动转化为应用层优势,平台公司(微软、谷歌)可以走“没有最强模型,但构建最强系统”的差异化路径。MDASH底层模型的复用性也使得新模型出来后只需A/B测试即可无缝接入,前期工程资产可全部复用。

对用户/开发者/创作者的影响

对普通用户,最直接的影响是补丁规模将越来越大——微软已明确表示以后的Patch Tuesday会更大,因为AI加速了漏洞发现速度。用户需及时安装系统更新,否则连不懂技术的人也能借助AI利用这类漏洞。对安全开发者,MDASH展示了多Agent系统在专业审计领域的工程实践方向:准备、扫描、验证、去重、证明五个阶段的拆解思路,以及模型之间分歧转化为信号的方法论,具有参考价值。对AI应用开发者,MDASH的“系统>模型”启示意味着在垂直场景中,工程化的Agent调度能力可能比一味追求最强基础模型更具性价比。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,微软尚未公布MDASH的定价和正式发布时间,目前正像Mythos和GPT-5.5 Cyber一样进行小范围客户私测,产品商用化节奏值得留意。第二,MDASH团队多位核心成员来自DARPA AI网络挑战赛优胜队伍Team Atlanta,验证过“工程量远超模型本身”这一判断,未来可能将系统能力扩展到Windows之外的更多平台和软件。第三,攻击者同样能使用公开可用的模型复现类似能力,AI安全攻防的军备竞赛节奏将显著加快,监管和行业标准是否会因此调整值得跟踪。

来源:36氪 · 24小时热榜

celebrityanime
celebrityanime
文章: 2162

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注