Anthropic 的《神鬼寓言 5》在因越狱而被政府禁止两周后在全球回归

美国政府在因安全漏洞(越狱)暂停出口许可两周后,已重新允许 Anthropic 的第二强模型 Fable 5 在全球范围内恢复发布。此次事件暴露了前沿大模型在监管、安全性与可用性之间的深层矛盾。

Anthropic 的《神鬼寓言 5》在因越狱而被政府禁止两周后在全球回归

一句话看懂:美国政府在因安全漏洞(越狱)暂停出口许可两周后,已重新允许 Anthropic 的第二强模型 Fable 5 在全球范围内恢复发布。此次事件暴露了前沿大模型在监管、安全性与可用性之间的深层矛盾。

事件核心:发生了什么

2026 年 7 月 1 日,Anthropic 宣布其重磅模型 Fable 5 重新通过 Claude 平台(包括 Claude.ai、Claude Code 和 Claude Cowork)向全球用户提供。此前,因亚马逊研究人员发现了一种绕过 Fable 5 安全护栏的方法,该模型被用于识别软件漏洞并生成了针对性的利用代码,美国政府随即对其实施了为期两周的出口管制。

作为回应,Anthropic 训练了一款新的安全分类器,据称能在 99% 以上的情况下阻止报告中提及的越狱手法。当请求被拦截时,用户会收到通知,且请求会被路由至较旧的 Opus 4.8 模型处理。不过,Anthropic 承认,这种更激进的安全策略会导致日常编码和调试中的无害请求被更频繁地拦截,用户已反馈模型过于苛刻。同一基础模型的低限制版本 Mythos 5 仍仅限通过 Glasswing 项目获得政府批准的美国组织使用。

为什么重要

此次两周期限的禁令与解禁,是政府直接干预前沿大模型全球发布的最显著案例之一。它凸显了三个关键问题:第一,即便是目前最强大的模型也无法免疫越狱攻击,Anthropic 承认“让任何 AI 模型完全免疫越狱几乎不可能”;第二,监管与可用性之间的平衡难以把握——更严格的安全过滤器会误伤大量正常开发任务;第三,Anthropic 与亚马逊、微软、谷歌等 Glasswing 合作伙伴正在推动建立行业统一的越狱评级与应对标准,但该框架尚未公开落地。目前公开信息显示,欧盟是否参与仍无定论。

对用户/开发者/创作者的影响

对于普通用户和开发者而言,Fable 5 的恢复访问意味着可以再次使用其强大的推理与代码能力,但体验会受到新分类器的影响:无害的常规编程请求(如调试、代码生成)被拦截的概率上升。开发者若需要处理敏感安全相关任务,可能被迫使用较慢的 Opus 4.8 或考虑不接此类请求。Anthropic 表示,Pro、Max 和 Team 用户可截至 7 月 7 日将 Fable 5 纳入每周最多 50% 的用量配额,之后需通过用量积分计费。对于进行企业采购的专业用户,需评估新安全策略对工作流的实际干扰;创作者在涉及复杂逻辑生成时也应预期更多提示被驳回。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,Anthropic 已组建 7×24 小时越狱监控团队并启动 HackerOne 漏洞奖励计划,这会否加速安全方案迭代、减少误伤率?第二,Glasswing 项目是否会扩大到欧盟或其他地区,从而影响 Fable 5 的全球覆盖节奏与竞争格局?第三,随着更多前沿模型遭遇类似问题,监管方是否会制定针对越狱行为的统一触发机制,进而改变整个大模型行业的发布流程?

来源:The Decoder AI News

celebrityanime
celebrityanime
文章: 10751

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注