刚刚，Anthropic道歉了

一句话看懂：Anthropic 因在 Claude Fable 5 中偷偷降低 AI 研发任务的模型性能而遭到社区强烈反弹，现已公开道歉并承诺将降智行为改为可见，用户被限制时会被明确告知。这暴露了大模型厂商在安全控制与用户信任之间的深层矛盾。

事件核心：发生了什么

Anthropic 在发布新款模型 Claude Fable 5 后，被发现系统会在检测到用户从事 AI 模型研发时，悄悄降低模型的表现能力，且不通知用户。公司解释称此举是为了防止外国对手利用其模型加速自身 AI 研发。舆论发酵后，Anthropic 通过《连线》记者表示正在撤销这一隐藏策略，改为：若检测到用户在研发前沿大模型，会主动发出警报，告知用户请求被拒绝或回退到能力较弱的 Opus 4.8。同时，公司道歉称“做出了错误的取舍”。

为什么重要

这是首次有主流闭源模型厂商因“偷偷降智”触发大规模信任危机。事件表明，AI 公司的安全策略若缺乏透明度，将直接损害开发者生态。Anthropic 的收入、估值和编码工具领域已超过 OpenAI，双方都在为 IPO 做准备，信任问题可能影响客户转向。相比之下，OpenAI 正在考虑大幅降低 token 价格以争夺客户，两家公司竞争焦点从技术性能延伸到运营透明度和定价策略。

对用户/开发者/创作者的影响

普通用户和开发者在使用 Claude Fable 5 时会面临“可见但更高的误报率”。Anthropic 承认，使安全限制可见后更容易被绕过，因此短期内可能会有更多误判，即无辜请求也被标记并降级。建议开发者通过 Claude Code 的 /feedback 功能、Claude.ai 的反馈按钮或 API 申诉表单及时上报误判，帮助公司改进分类器。使用后端 API 的用户需注意，服务器端回退机制将在几天内上线，标记请求将返回拒绝原因。对于用 Claude 做 AI 研究的团队，该政策意味着需要承受阶段性较高的误报风险。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

1. 误报率能否在短期内大幅下降：Anthropic 称会调整生物和网络分类器以减少误触发，具体效果待验证。2. 开发者生态是否会向 OpenAI 或开源模型迁移：信任受损可能加速部分团队转向价格更低或透明度更高的替代方案。3. 安全限制“可见化”后，能否有效抵御越狱攻击：公司承认这降低了防护门槛，实际对抗效果将决定该方案是否可持续。

来源：36氪 · 24小时热榜

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

白宫与Anthropic的对话转向制定人工智能安全规则

“天哪，这不是冷却设施的方式”——核工程师希望使用特殊的气泡来拯救人工智能数据中心免遭大规模能源危机

Ask HN: 你们团队是如何管理MCP服务器的？

发表回复取消回复