Anthropic 增加了一项新的安全措施,以重新获得特朗普政府的青睐

Anthropic 为让特朗普政府解除对其 Claude Fable 5 模型的出口管制,同意扩展一项现有限制措施:当用户试图解锁某些敏感能力时,请求会被拦截并降级至上一代模型 Opus 4.8 处理。这一妥协换回了此前被暂停的模型发布权限。

Anthropic 增加了一项新的安全措施,以重新获得特朗普政府的青睐

一句话看懂:Anthropic 为让特朗普政府解除对其 Claude Fable 5 模型的出口管制,同意扩展一项现有限制措施:当用户试图解锁某些敏感能力时,请求会被拦截并降级至上一代模型 Opus 4.8 处理。这一妥协换回了此前被暂停的模型发布权限。

事件核心:发生了什么

根据 Wired 报道,特朗普政府此前以“涉及敏感网络安全和生物学能力”为由,对 Anthropic 的 Claude Fable 5 模型实施出口管制,实际上使其陷入不可用状态。Anthropic 的应对方案是,将原本仅在“敏感网络安全和生物学请求”上生效的降级限制,扩展至覆盖一项由 Amazon 论文所指出的特定行为——用户可通过要求模型“修复代码”而非“识别安全隐患”来绕过原有的安全护栏。

美国商务部长 Howard Lutnick 在宣布解除限制的信件中确认,Anthropic 同意“主动检测并处理模型带来的安全风险”。同时,商务部旗下 AI 标准与创新中心在评估后认为 Fable 5 的现有防护措施“目前足够稳健”,因此批准其发布。不过,国防部长 Pete Hegseth 仍对顾问表示,目前没有明确路径解除他在2月28日将该公司列为“供应链风险来源”的指令。

为什么重要

这次事件反映了 AI 公司与美国政府之间复杂的合规博弈:出口管制成为调节模型安全性的行政工具,而非纯粹的技术安全评估。Anthropic 通过具体、可验证的技术让步(而非模糊承诺)来换取放行,意味着未来其他 AI 公司若遭遇类似限制,可能也需要提前设计可执行的“降级”或“回退”方案。此外,此举强化了一个趋势:政府对前沿 AI 能力的监控正从“模型发布前”延伸到“发布后使用行为”,并且将学术界和产业界的安全研究论文直接作为执法依据。

对用户/开发者/创作者的影响

对使用 Claude Fable 5 API 的开发者:如果请求命中新的安全限制,将自动获得通知且实际调用 Opus 4.8,这意味着高敏感业务(如自动化漏洞分析、生物序列生成等)可能无法获得预期的推理质量。对普通用户,只要不主动尝试解锁受限能力,日常对话体验不受影响。但这一事件也暗示:未来想使用最前沿模型的“完全能力”,可能需要在特定地域、特定场景下接受额外身份验证或白名单审批。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

一、国防部“供应链风险”标签尚未撤销,Anthropic 是否能进入政府招标或合作项目仍存在不确定性。二、Amazon 论文中描述的那个“绕过漏洞”是否会成为行业标准测试用例,被其他安全研究机构用来评估所有闭源模型的鲁棒性。三、Anthropic 的这一“降级式安全护栏”机制是否会被其他 AI 公司采纳,成为应对未来政府审查的通用技术方案。

来源:Wired AI

celebrityanime
celebrityanime
文章: 10838

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注