突发！Anthropic呼吁全员停止AI研究

一句话看懂：Anthropic发布内部数据称Claude已承担公司80%以上代码编写任务，且AI自行设计下一代AI的“递归自我提升”趋势明显加速。该团队呼吁行业达成可验证的暂停机制，以防范对齐失控风险。

事件核心：发生了什么

Anthropic在一篇长文博客中披露了多项关键数据：截至今年5月，公司代码库中超过80%由Claude生成，而Claude Code发布前这一比例仅为个位数。工程师每季度交付的代码量是2021至2025年的8倍。在最具挑战的编程任务上，Claude成功率从六个月前的26%跃升至76%。Anthropic还引入了一个全新衡量维度——“AI能独立完成的任务时长”，从2024年的4分钟，到2025年的1.5小时，再到最新的测试版本已连续工作16小时以上，翻倍周期从7个月加速至4个月。若趋势不变，2027年该时长可能达到数周。在产品层面，Claude Mythos Preview已将训练小型AI模型的优化速度提升至52倍，远超人类研究员的4倍水平。在AI安全研究任务中，Claude将两个模型的监督差距缩小了97%，而人类团队仅缩小23%。基于此，Anthropic公开呼吁：若能建立可验证的机制确保所有实验室都不偷偷加速竞赛，他们愿意减速甚至暂停研究。

为什么重要

这标志着“递归自我提升”（RSI）从理论假设变为可观测的行业事实。Anthropic的数据表明，AI不仅在被人类训练，也开始实质性地参与下一轮AI系统的设计、编码和验证。这改变了AI研发的边际成本结构：过去依赖人力堆砌的工程和研究工作，正被AI以指数级效率替代。对于整个行业而言，这意味着“AI发展速度由算力而非人力决定”的临界点可能提前到来，而治理层面的对齐与安全问题也随之变得更为紧迫——偏差可能在自我迭代中逐步累积，最终失控。Anthropic选择在IPO前公开这一风险信号，也透露出其试图在商业利益与安全责任之间建立自律性边界。

对用户/开发者/创作者的影响

对开发者而言，AI编程工具的能力正在从“代码补全”跃迁至“代码审查与自主实验设计”，这意味着重复性编码工作的价值加速衰减，而研究品味、方向判断等高阶技能成为新的瓶颈。对于创作者和普通用户，AI能独立完成的任务时长越长，意味着未来AI工具处理复杂项目（如软件漏洞挖掘、数据分析、内容生成）的可靠性和深度将大幅提升。但同时，Anthropic指出，大约三分之一导致线上事故的bug原本可被Claude自动审查拦截——这提示开发者应尽快将AI审查纳入常规工作流，否则可能在质量竞争中被淘汰。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

首先，Anthropic提出的“可验证暂停机制”是否会有其他实验室响应，尤其是OpenAI在几日前也发布了类似“自进化早期迹象”的博客，行业是否会形成统一的减速协议值得追踪。其次，Claude的模型迭代节奏能否维持每4个月翻倍的能力曲线，以及阿姆达尔定律是否会在组织层面重新出现瓶颈（如代码review、实验消化能力），将直接影响AI研发效率的上限。最后，若RSI趋势持续，算力供应链（芯片、能源）的瓶颈可能取代算法成为新的制约因素，这会对算力租赁价格和中小开发者的准入成本产生实质性影响。

来源：36氪 · 24小时热榜

突发！Anthropic呼吁全员停止AI研究