Anthropic 增加了一项新的安全措施，以重新获得特朗普政府的青睐

一句话看懂：Anthropic 为让特朗普政府解除对其 Claude Fable 5 模型的出口管制，同意扩展一项现有限制措施：当用户试图解锁某些敏感能力时，请求会被拦截并降级至上一代模型 Opus 4.8 处理。这一妥协换回了此前被暂停的模型发布权限。

事件核心：发生了什么

根据 Wired 报道，特朗普政府此前以“涉及敏感网络安全和生物学能力”为由，对 Anthropic 的 Claude Fable 5 模型实施出口管制，实际上使其陷入不可用状态。Anthropic 的应对方案是，将原本仅在“敏感网络安全和生物学请求”上生效的降级限制，扩展至覆盖一项由 Amazon 论文所指出的特定行为——用户可通过要求模型“修复代码”而非“识别安全隐患”来绕过原有的安全护栏。

美国商务部长 Howard Lutnick 在宣布解除限制的信件中确认，Anthropic 同意“主动检测并处理模型带来的安全风险”。同时，商务部旗下 AI 标准与创新中心在评估后认为 Fable 5 的现有防护措施“目前足够稳健”，因此批准其发布。不过，国防部长 Pete Hegseth 仍对顾问表示，目前没有明确路径解除他在2月28日将该公司列为“供应链风险来源”的指令。

为什么重要

这次事件反映了 AI 公司与美国政府之间复杂的合规博弈：出口管制成为调节模型安全性的行政工具，而非纯粹的技术安全评估。Anthropic 通过具体、可验证的技术让步（而非模糊承诺）来换取放行，意味着未来其他 AI 公司若遭遇类似限制，可能也需要提前设计可执行的“降级”或“回退”方案。此外，此举强化了一个趋势：政府对前沿 AI 能力的监控正从“模型发布前”延伸到“发布后使用行为”，并且将学术界和产业界的安全研究论文直接作为执法依据。

对用户/开发者/创作者的影响

对使用 Claude Fable 5 API 的开发者：如果请求命中新的安全限制，将自动获得通知且实际调用 Opus 4.8，这意味着高敏感业务（如自动化漏洞分析、生物序列生成等）可能无法获得预期的推理质量。对普通用户，只要不主动尝试解锁受限能力，日常对话体验不受影响。但这一事件也暗示：未来想使用最前沿模型的“完全能力”，可能需要在特定地域、特定场景下接受额外身份验证或白名单审批。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

一、国防部“供应链风险”标签尚未撤销，Anthropic 是否能进入政府招标或合作项目仍存在不确定性。二、Amazon 论文中描述的那个“绕过漏洞”是否会成为行业标准测试用例，被其他安全研究机构用来评估所有闭源模型的鲁棒性。三、Anthropic 的这一“降级式安全护栏”机制是否会被其他 AI 公司采纳，成为应对未来政府审查的通用技术方案。

来源：Wired AI

Anthropic 增加了一项新的安全措施，以重新获得特朗普政府的青睐

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

make validate_and_set_defaults sane

webapp Public link inaccessible

Open in Explore shows unavailable or missing app for unpublished workflow apps

发表回复取消回复