
一句话看懂:美国政府在6月12日对Anthropic最新模型Claude Fable 5和Mythos 5实施出口管制,迫使Anthropic暂停全球访问;经过近三周的谈判与安全改进,管制已于6月30日解除,Fable 5将从7月1日起重新面向全球用户开放。
事件核心:发生了什么
2026年6月9日,Anthropic同时发布了Fable 5和Mythos 5,两者共享同一基础模型,但Mythos 5的安全护栏更少,仅限Project Glasswing中受信任的合作伙伴用于防御性网络安全研究。6月12日,美国政府因亚马逊研究人员发现了一种能够绕过Fable 5安全护栏的技术(即通过特定提示让模型识别软件漏洞并生成利用性代码),立即对这两个模型施加出口管制。Anthropic无法实时验证用户国籍,被迫暂停了所有用户的访问权限。6月26日,美国政府批准重新允许部分美国组织访问Mythos 5;6月30日,出口管制全面解除。Fable 5将于7月1日恢复全球访问,初期对Pro、Max、Team及部分Enterprise用户每周最多50%的用量免费,7月7日后转为按量计费。
为什么重要
这一事件是AI行业首次因模型安全漏洞被直接触发出口管制,其示范效应远超Anthropic一家公司。Anthropic的测试显示,包括Claude Opus 4.8、GPT-5.5、Kimi K2.7在内的多款主流模型均可复现同样的漏洞识别行为,这意味着当前行业普遍缺乏对”越狱”行为严重程度的统一评级标准。Anthropic、亚马逊、微软、谷歌等Glasswing合作伙伴已开始共同制定这一行业框架,未来可能影响所有高能力模型的安全审查流程。同时,Anthropic与美国政府建立了更深入的预发布测试、信息共享和研究协作机制,这意味着AI模型上线前将面临更强的政府审查,或将成为行业新常态。
对用户/开发者/创作者的影响
对全球开发者而言,Fable 5已重新可用,但短期内的免费额度有限(每周最多50%用量),7天后将转为按量计费;通过AWS、Google Cloud、Microsoft Foundry等云平台的API接入需等待数日恢复。对企业用户而言,Mythos 5的访问仍需经过美国政府单独审批,且仅限美国组织参与Glasswing计划,国际合作伙伴的加入时间尚未明确。对一般用户而言,Fable 5的防护措施有所加强:新增的安全分类器可在99%以上场景拦截报告中所述的越狱行为,一旦请求被拦截,系统会自动将用户请求转至Claude Opus 4.8处理。这一变更降低了恶意利用风险,但也意味着防御性网络安全研究所需的某些低风险能力可能受到更严格限制。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,行业级”越狱严重性评级框架”的具体落地时间表——若各方达成一致,未来所有高能力模型在发布前可能都需要经过独立第三方按统一标准评估,这会显著拉长产品上线周期。第二,Mythos 5何时能扩大至更多国际Glasswing合作伙伴,以及美国政府是否会将其作为AI模型出口管制的标杆案例,影响其他公司类似产品的出海策略。第三,当前亚马逊报告的越狱技术并非利用Mythos级别的独特能力,而是Fable 5安全护栏对某些低风险但被阻断行为的边界误判,后续Anthropic是否会调整安全策略的”过度谨慎”倾向,值得持续观察。


