
微软 MDASH 安全系统一举超越 GPT-5.5,挑战漏洞扫描新高度!
一句话看懂:微软于2025年5月13日正式发布多模型代理扫描框架MDASH,该系统在漏洞识别能力上超越GPT-5.5和Anthropic的Mythos模型,并在公开测试中实现了100%的识别率与零误报,为软件安全检测设定了新的性能基准。
事件核心:发生了什么
微软代码安全团队于5月13日发布了MDASH,这是一个多模型代理扫描框架。与依赖单一AI模型不同,MDASH集成了超过100个AI代理,每个代理负责从代码准备、漏洞扫描到结果验证的不同阶段。在核心推理任务中使用最强模型,在处理大量代码时切换至响应更快的轻量级模型。在CyberGym公开基准测试中,MDASH成功识别了16个此前未知的漏洞,包括四个高危远程代码执行漏洞;在针对21个有意植入漏洞的私有测试中,实现了100%识别率且零误报。此外,在对历史漏洞的回顾性测试中,MDASH对clfs.sys五年内的漏洞恢复率达96%,对tcpip.sys的恢复率达100%。
为什么重要
MDASH证明了“多代理协作”架构在安全领域的实际效能已超越当前最强的单一大模型(如GPT-5.5)。这意味着在需要高精度和低误报率的任务中,将多个模型编排成工作流比单纯扩大单模型规模更有效。对于AI行业竞争格局而言,微软不止步于追赶通用大模型竞赛,而是利用多模型协同在垂直安全场景中建立技术壁垒,这为其他企业如何将AI落地到具体业务提供了新思路。
对用户/开发者/创作者的影响
对企业安全团队:MDASH目前已开始协助微软内部工程团队进行产品安全增强,并面向部分客户提供内部预览。如果未来商业化开放,企业可以用更低的误报率(零误报)和更高的历史漏洞恢复率(96%-100%)来替代或辅助现有漏洞扫描工具,减少人工审计成本。对开发者:多代理框架设计理念意味着未来安全工具将更加“即插即用”,开发者可能需要学习如何编排不同AI模型来完成特定任务,而非仅依赖单一API。对AI模型提供商:MDASH的表现提示模型能力不能只看通用测试榜,针对特定任务(如代码安全)的协作优化可能成为新的竞争维度。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
1. 产品落地范围:目前仅限于微软内部和有限客户预览,需关注MDASH是否会作为Azure安全服务或独立产品向公众开放,以及定价策略。
2. 竞品跟进:GPT-5.5和Mythos的研发方是否会在下一版本中专门针对漏洞扫描任务进行微调或加入类似多代理机制。
3. 开源可能性:多代理框架的架构细节目前未完全公开,如果微软选择开源部分代理或接口,可能会催生一批基于MDASH的第三方安全工具生态。
来源:AIbase


