刚刚,Anthropic道歉了

Anthropic 因在 Claude Fable 5 中偷偷降低 AI 研发任务的模型性能而遭到社区强烈反弹,现已公开道歉并承诺将降智行为改为可见,用户被限制时会被明确告知。这暴露了大模型厂商在安全控制与用户信任之间的深层矛盾。

刚刚,Anthropic道歉了

一句话看懂:Anthropic 因在 Claude Fable 5 中偷偷降低 AI 研发任务的模型性能而遭到社区强烈反弹,现已公开道歉并承诺将降智行为改为可见,用户被限制时会被明确告知。这暴露了大模型厂商在安全控制与用户信任之间的深层矛盾。

事件核心:发生了什么

Anthropic 在发布新款模型 Claude Fable 5 后,被发现系统会在检测到用户从事 AI 模型研发时,悄悄降低模型的表现能力,且不通知用户。公司解释称此举是为了防止外国对手利用其模型加速自身 AI 研发。舆论发酵后,Anthropic 通过《连线》记者表示正在撤销这一隐藏策略,改为:若检测到用户在研发前沿大模型,会主动发出警报,告知用户请求被拒绝或回退到能力较弱的 Opus 4.8。同时,公司道歉称“做出了错误的取舍”。

为什么重要

这是首次有主流闭源模型厂商因“偷偷降智”触发大规模信任危机。事件表明,AI 公司的安全策略若缺乏透明度,将直接损害开发者生态。Anthropic 的收入、估值和编码工具领域已超过 OpenAI,双方都在为 IPO 做准备,信任问题可能影响客户转向。相比之下,OpenAI 正在考虑大幅降低 token 价格以争夺客户,两家公司竞争焦点从技术性能延伸到运营透明度和定价策略。

对用户/开发者/创作者的影响

普通用户和开发者在使用 Claude Fable 5 时会面临“可见但更高的误报率”。Anthropic 承认,使安全限制可见后更容易被绕过,因此短期内可能会有更多误判,即无辜请求也被标记并降级。建议开发者通过 Claude Code 的 /feedback 功能、Claude.ai 的反馈按钮或 API 申诉表单及时上报误判,帮助公司改进分类器。使用后端 API 的用户需注意,服务器端回退机制将在几天内上线,标记请求将返回拒绝原因。对于用 Claude 做 AI 研究的团队,该政策意味着需要承受阶段性较高的误报风险。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

1. 误报率能否在短期内大幅下降:Anthropic 称会调整生物和网络分类器以减少误触发,具体效果待验证。2. 开发者生态是否会向 OpenAI 或开源模型迁移:信任受损可能加速部分团队转向价格更低或透明度更高的替代方案。3. 安全限制“可见化”后,能否有效抵御越狱攻击:公司承认这降低了防护门槛,实际对抗效果将决定该方案是否可持续。

来源:36氪 · 24小时热榜

celebrityanime
celebrityanime
文章: 8687

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注