Ask HN: Anthropic 目前不是正在为 Mythos 采用“隐蔽性安全”策略吗？

一句话看懂：Hacker News 上有用户质疑 Anthropic 对 Mythos 模型采取“隐蔽性安全”（security through obscurity）策略，即通过隐藏漏洞而非修复漏洞来维持安全假象，这一讨论正触及 AI 安全治理的核心矛盾：闭源封锁是否比开放修复更有效。

事件核心：发生了什么

在 Hacker News 上，针对 Anthropic 旗下模型 Mythos 的安全策略，有用户提出尖锐批评。核心观点是：如果 Mythos 真的强大到只需两个提示词就能攻破 NASA 系统，那么正确的做法不是让所有人噤声、掩盖漏洞，而是允许用户发现漏洞并推动修复。讨论指出，当前的闭源“隐蔽性安全”策略——即不公开模型或漏洞细节——实际上是用保密替代安全工程。用户还预判，即使今天封住 Mythos，两年后会出现 OpenMythos，六年后会有 DeepMythos，AI 技术演进不可阻挡，最终唯有让代码本身能抵御模型攻击才是长久之计。

为什么重要

这场辩论直击 AI 安全领域的路线之争。一方面，Anthropic 等闭源 AI 公司倾向于通过限制模型访问、不公开权重来防止恶意使用，这本质上是“通过不透明实现安全”。但批评者指出，这种做法在网络安全领域早已被证伪：真正的安全来自于漏洞的公开披露和快速修复，而非掩盖。如果 AI 系统存在严重安全隐患，闭源封锁只会让攻击者抢先利用漏洞，而防御者无从知晓。此外，讨论中点出的“开源 AI 终将涌现”的预言，挑战了闭源公司宣称的“只有闭源才能保证安全”的逻辑——如果未来开源模型同样强大，那么现在的闭源“安全”不过是延缓了问题的爆发期。

对用户/开发者/创作者的影响

对开发者来说，这一争议提示：依赖闭源大模型 API 构建应用时，需要评估底层模型的“安全假设”是否可靠。如果模型存在隐蔽漏洞，应用中集成的 AI 功能可能成为攻击入口，而开发者却因信息不透明无法提前修补。对普通用户而言，当前使用闭源 AI 产品时，应意识到“模型不公开”不等于“模型安全”，隐私和敏感操作需格外谨慎。对创作者和研究社区，这场讨论支持了一种观点：推动开源模型生态成熟，让更多眼睛参与安全审计，可能才是更可持续的安全策略。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，Anthropic 或其他闭源 AI 公司是否会公开回应“隐蔽性安全”质疑，并披露其安全策略的具体运作机制。第二，是否有安全研究人员或白帽黑客尝试对 Mythos 等闭源模型进行独立安全评估，以及 Anthropic 是否建立漏洞赏金或负责任的披露机制。第三，开源社区是否会加速推出挑战闭源模型安全性能的替代项目，如开源代码审计工具或去中心化安全测试平台，从而验证“开放者更安全”的论断。

来源：news.ycombinator.com

Ask HN: Anthropic 目前不是正在为 Mythos 采用“隐蔽性安全”策略吗？

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

欧洲能否利用其拥有的计算能力训练前沿人工智能模型？

Show HN：Fata – 间隔重复以对抗 AI 编码造成的技能衰退

克劳德军团

发表回复取消回复