
一句话看懂:Anthropic 因美国出口管制令下架了具备高级网络攻防能力的 Claude Fable 5 和 Mythos 5 模型,但专家指出,这类“危险”能力将在未来半年到两年内被更多公司和开源模型普及,管制只能延缓,无法阻止。
事件核心:发生了什么
上周晚些时候,Anthropic 按照美国政府出口管制指令,将最新模型 Claude Fable 5 和 Mythos 5 下线,禁止“任何外国国民”使用。Mythos 5 自 4 月发布以来就被该公司描述为“双刃剑”:既能帮助安全专家发现漏洞并修补,也能被恶意行为者利用进行攻击。Anthropic 最初通过一个名为 Project Glasswing 的工作组向特定联盟发布了 Mythos Preview,并将具备同等能力的 Fable 5 面向公众开放,但限制了其在生物和网络安全领域的回答能力。然而,特朗普政府认为 Fable 5 的护栏可以被绕过,从而获得完整且可能构成国家安全威胁的 Mythos 5 能力,因此强制限用。
为什么重要
这起事件揭示了 AI 监管的一个核心悖论:管制一个模型并不能消除风险。TPO Group 首席安全官 Tarah Wheeler 指出,认为“只有 Anthropic 能开发出这类能力”是极为短视的,其他公司很可能已经具备类似能力,只是在观望监管环境。Anthropic 自己的红队负责人 Logan Graham 在今年 4 月就警告过,“需要在 6、12、24 个月内为能力广泛可用的世界做好准备”。OpenAI 也在 4 月中旬私下发布了一个网络安全模型,并宣布了更广泛的网络安全策略。哈佛大学研究员 Bruce Schneier 分析称,更小、更便宜的开源模型通过更复杂的提示词编排,可以匹配甚至超越 Mythos 的表现,且这种能力差距在几个月内就会弥合。因此,此次管制并未触及问题本质,反而可能拖延了真正需要的、民主且透明的全局性应对方案。
对用户/开发者/创作者的影响
对 AI 安全从业者和开源模型开发者而言,这既是警示也是机遇。警示在于,未来 6 到 12 个月内,具备类似高级漏洞挖掘和利用能力的开源模型或 API 可能会成批出现,企业采购 AI 工具时需更严格评估安全风险与合规边界。对于普通用户,目前大众可用的 ChatGPT、Claude 等模型仍维持在安全护栏内,但长期看,除非监管和技术对等跟进,否则部分“危险”能力可能以开源模型形式流入个人开发者手中,加剧安全攻防的不对称。创作者和内容生态从业者目前不受直接影响,但后续需关注生物与网络安全相关内容的审核或限制是否升级。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,Anthropic 与白宫的谈判结果。若未能达成复营协议,可能导致更多公司选择将前沿模型仅在“安全且合规的圈子”内部测试,而非公开上线;第二,开源社区的跟进速度。若 Meta、Mistral 等公司的下一代模型在 12 个月内展示出类似的漏洞利用能力,将直接验证专家们的判断;第三,政策制定者的转向。正如 Veracode 联合创始人 Chris Wysopal 所言,问题的关键不在于技术有无风险,而在于“某项限制是否真正降低了风险,还是只拖慢了试图让系统更安全的人”。
来源:Wired AI


