
一句话看懂:Hacker News 上有用户质疑 Anthropic 对 Mythos 模型采取“隐蔽性安全”(security through obscurity)策略,即通过隐藏漏洞而非修复漏洞来维持安全假象,这一讨论正触及 AI 安全治理的核心矛盾:闭源封锁是否比开放修复更有效。
事件核心:发生了什么
在 Hacker News 上,针对 Anthropic 旗下模型 Mythos 的安全策略,有用户提出尖锐批评。核心观点是:如果 Mythos 真的强大到只需两个提示词就能攻破 NASA 系统,那么正确的做法不是让所有人噤声、掩盖漏洞,而是允许用户发现漏洞并推动修复。讨论指出,当前的闭源“隐蔽性安全”策略——即不公开模型或漏洞细节——实际上是用保密替代安全工程。用户还预判,即使今天封住 Mythos,两年后会出现 OpenMythos,六年后会有 DeepMythos,AI 技术演进不可阻挡,最终唯有让代码本身能抵御模型攻击才是长久之计。
为什么重要
这场辩论直击 AI 安全领域的路线之争。一方面,Anthropic 等闭源 AI 公司倾向于通过限制模型访问、不公开权重来防止恶意使用,这本质上是“通过不透明实现安全”。但批评者指出,这种做法在网络安全领域早已被证伪:真正的安全来自于漏洞的公开披露和快速修复,而非掩盖。如果 AI 系统存在严重安全隐患,闭源封锁只会让攻击者抢先利用漏洞,而防御者无从知晓。此外,讨论中点出的“开源 AI 终将涌现”的预言,挑战了闭源公司宣称的“只有闭源才能保证安全”的逻辑——如果未来开源模型同样强大,那么现在的闭源“安全”不过是延缓了问题的爆发期。
对用户/开发者/创作者的影响
对开发者来说,这一争议提示:依赖闭源大模型 API 构建应用时,需要评估底层模型的“安全假设”是否可靠。如果模型存在隐蔽漏洞,应用中集成的 AI 功能可能成为攻击入口,而开发者却因信息不透明无法提前修补。对普通用户而言,当前使用闭源 AI 产品时,应意识到“模型不公开”不等于“模型安全”,隐私和敏感操作需格外谨慎。对创作者和研究社区,这场讨论支持了一种观点:推动开源模型生态成熟,让更多眼睛参与安全审计,可能才是更可持续的安全策略。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,Anthropic 或其他闭源 AI 公司是否会公开回应“隐蔽性安全”质疑,并披露其安全策略的具体运作机制。第二,是否有安全研究人员或白帽黑客尝试对 Mythos 等闭源模型进行独立安全评估,以及 Anthropic 是否建立漏洞赏金或负责任的披露机制。第三,开源社区是否会加速推出挑战闭源模型安全性能的替代项目,如开源代码审计工具或去中心化安全测试平台,从而验证“开放者更安全”的论断。


