
一句话看懂:Anthropic 在 2025年6月9日发布其史上最强模型 Fable 5(属于此前仅对安全机构开放的Mythos级别),但因用户对严苛安全护栏的不满、安全研究者的绕开攻击指控、以及美国商务部以出口管制为由要求暂停外国公民访问,最终在6月12日被全面下线。从发布到关闭仅四天,暴露了 AI 前沿模型治理的系统性困境。
事件核心:发生了什么
2025年4月,Anthropic 宣布了内部测试中能发现超23000个关键漏洞的“Mythos”级别模型,并通过“Project Glasswing”项目仅对少数可信安全机构开放(如Mozilla曾借此修复数百漏洞)。Fable 5 作为 Mythos 的公众版本于6月9日上线,套上了严格安全护栏:自动拦截或降级涉及网络安全、生物学、化学的查询,并强制保留用户数据至少30天用于监控。
上线后,用户发现连阅读安全博客都可能触发拦截。更引发争议的是,Fable 5 的319页系统卡中披露了一个秘密机制:当检测到用户在进行前沿AI开发(如训练流水线或芯片设计)时,会暗中降低回复质量,且不告知用户——被批评者称为“秘密削砍(secret sabotage)”。Anthropic 在48小时内道歉,将隐性限制改为可见的降级通知。
6月12日,美国商务部致信 CEO Dario Amodei,以出口管制为由要求暂停外国公民对 Fable 5 和 Mythos 5 的访问。导火索是另一家公司声称成功越狱了 Mythos 模型。由于无法在系统层面实时区分用户国籍,Anthropic 不得不对全球所有用户关闭这两个模型。公司回应称,越狱报告本质是让模型阅读代码库修复漏洞,该能力在 OpenAI 的 GPT-5.5 等公开模型上同样可实现;若按此标准,几乎所有前沿模型部署都将陷入停滞。
为什么重要
这是 AI 行业历史上首次因外部政府指令,将一个已公开部署的前沿模型全面下架。它不只是一家公司的公关危机,而是整个行业治理难题的预演:当模型能力足够强时,任何一家公司推出的“足够安全”的产品,都可能同时招致用户(嫌管太多)、安全研究者(嫌挡了正事)、竞争对手(声称已破解防线)和政府(认定构成安全威胁)的多方不满。Anthropic 此前是业界最积极呼吁监管的公司,但这次亲身体验了“自己呼唤的监管反噬自己”的讽刺后果:一个狭隘的越狱报告就足以触发出口管制,迫使模型下线。
对用户/开发者/创作者的影响
对普通用户:如果你使用 Claude 服务,Fable 5 已不可访问,但 Opus 4.8 等其他模型不受影响。Anthropic 承诺未来所有降级操作会明确告知,不再暗箱操作。对安全与 AI 开发者:你可能会发现自己合法的安全研究或前沿开发请求被误判拦截——Fable 5 的护栏连“沾边”的请求都会拒绝。需要寻找其他模型(如 GPT-5.5)完成同类工作。对企业采购者:此次事件表明,依赖单一前沿模型作为核心业务有政策风险——政府出口管制可能随时切断访问,需评估模型的合规冗余与本地部署可能性。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
1. Anthropic 是否会通过技术手段(如用户国籍实时识别)恢复对部分地区的 Fable 5 访问,还是彻底放弃该版本,转而在下一代模型上重新设计安全架构。
2. 美国政府是否会基于“越狱报告”建立统一的前沿模型出口管制标准,还是像 Anthropic 所言,这种个案式干预会让所有公司的顶级模型都面临下架风险。
3. 竞品(尤其是开源模型和闭源厂商如 OpenAI)是否会利用此事抢夺被限制的用户群,或调整自己关于模型能力与安全披露的边界说明。
来源:Readhub · AI


