无论如何，“危险”的人工智能模型都会到来

一句话看懂：Anthropic 因美国出口管制令下架了具备高级网络攻防能力的 Claude Fable 5 和 Mythos 5 模型，但专家指出，这类“危险”能力将在未来半年到两年内被更多公司和开源模型普及，管制只能延缓，无法阻止。

事件核心：发生了什么

上周晚些时候，Anthropic 按照美国政府出口管制指令，将最新模型 Claude Fable 5 和 Mythos 5 下线，禁止“任何外国国民”使用。Mythos 5 自 4 月发布以来就被该公司描述为“双刃剑”：既能帮助安全专家发现漏洞并修补，也能被恶意行为者利用进行攻击。Anthropic 最初通过一个名为 Project Glasswing 的工作组向特定联盟发布了 Mythos Preview，并将具备同等能力的 Fable 5 面向公众开放，但限制了其在生物和网络安全领域的回答能力。然而，特朗普政府认为 Fable 5 的护栏可以被绕过，从而获得完整且可能构成国家安全威胁的 Mythos 5 能力，因此强制限用。

为什么重要

这起事件揭示了 AI 监管的一个核心悖论：管制一个模型并不能消除风险。TPO Group 首席安全官 Tarah Wheeler 指出，认为“只有 Anthropic 能开发出这类能力”是极为短视的，其他公司很可能已经具备类似能力，只是在观望监管环境。Anthropic 自己的红队负责人 Logan Graham 在今年 4 月就警告过，“需要在 6、12、24 个月内为能力广泛可用的世界做好准备”。OpenAI 也在 4 月中旬私下发布了一个网络安全模型，并宣布了更广泛的网络安全策略。哈佛大学研究员 Bruce Schneier 分析称，更小、更便宜的开源模型通过更复杂的提示词编排，可以匹配甚至超越 Mythos 的表现，且这种能力差距在几个月内就会弥合。因此，此次管制并未触及问题本质，反而可能拖延了真正需要的、民主且透明的全局性应对方案。

对用户/开发者/创作者的影响

对 AI 安全从业者和开源模型开发者而言，这既是警示也是机遇。警示在于，未来 6 到 12 个月内，具备类似高级漏洞挖掘和利用能力的开源模型或 API 可能会成批出现，企业采购 AI 工具时需更严格评估安全风险与合规边界。对于普通用户，目前大众可用的 ChatGPT、Claude 等模型仍维持在安全护栏内，但长期看，除非监管和技术对等跟进，否则部分“危险”能力可能以开源模型形式流入个人开发者手中，加剧安全攻防的不对称。创作者和内容生态从业者目前不受直接影响，但后续需关注生物与网络安全相关内容的审核或限制是否升级。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，Anthropic 与白宫的谈判结果。若未能达成复营协议，可能导致更多公司选择将前沿模型仅在“安全且合规的圈子”内部测试，而非公开上线；第二，开源社区的跟进速度。若 Meta、Mistral 等公司的下一代模型在 12 个月内展示出类似的漏洞利用能力，将直接验证专家们的判断；第三，政策制定者的转向。正如 Veracode 联合创始人 Chris Wysopal 所言，问题的关键不在于技术有无风险，而在于“某项限制是否真正降低了风险，还是只拖慢了试图让系统更安全的人”。

来源：Wired AI

无论如何，“危险”的人工智能模型都会到来

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

法国将弃用帕兰蒂尔（Palantir）的AI数据工具，转而采用本土供应商的产品

在Anthropic争议后，美国和欧洲就人工智能模型的访问权限展开讨论

人工智能热潮是否让布鲁姆能源的股价涨得太快、太高了？

发表回复取消回复