
突发!Anthropic呼吁全员停止AI研究
一句话看懂:Anthropic发布内部数据称Claude已承担公司80%以上代码编写任务,且AI自行设计下一代AI的“递归自我提升”趋势明显加速。该团队呼吁行业达成可验证的暂停机制,以防范对齐失控风险。
事件核心:发生了什么
Anthropic在一篇长文博客中披露了多项关键数据:截至今年5月,公司代码库中超过80%由Claude生成,而Claude Code发布前这一比例仅为个位数。工程师每季度交付的代码量是2021至2025年的8倍。在最具挑战的编程任务上,Claude成功率从六个月前的26%跃升至76%。Anthropic还引入了一个全新衡量维度——“AI能独立完成的任务时长”,从2024年的4分钟,到2025年的1.5小时,再到最新的测试版本已连续工作16小时以上,翻倍周期从7个月加速至4个月。若趋势不变,2027年该时长可能达到数周。在产品层面,Claude Mythos Preview已将训练小型AI模型的优化速度提升至52倍,远超人类研究员的4倍水平。在AI安全研究任务中,Claude将两个模型的监督差距缩小了97%,而人类团队仅缩小23%。基于此,Anthropic公开呼吁:若能建立可验证的机制确保所有实验室都不偷偷加速竞赛,他们愿意减速甚至暂停研究。
为什么重要
这标志着“递归自我提升”(RSI)从理论假设变为可观测的行业事实。Anthropic的数据表明,AI不仅在被人类训练,也开始实质性地参与下一轮AI系统的设计、编码和验证。这改变了AI研发的边际成本结构:过去依赖人力堆砌的工程和研究工作,正被AI以指数级效率替代。对于整个行业而言,这意味着“AI发展速度由算力而非人力决定”的临界点可能提前到来,而治理层面的对齐与安全问题也随之变得更为紧迫——偏差可能在自我迭代中逐步累积,最终失控。Anthropic选择在IPO前公开这一风险信号,也透露出其试图在商业利益与安全责任之间建立自律性边界。
对用户/开发者/创作者的影响
对开发者而言,AI编程工具的能力正在从“代码补全”跃迁至“代码审查与自主实验设计”,这意味着重复性编码工作的价值加速衰减,而研究品味、方向判断等高阶技能成为新的瓶颈。对于创作者和普通用户,AI能独立完成的任务时长越长,意味着未来AI工具处理复杂项目(如软件漏洞挖掘、数据分析、内容生成)的可靠性和深度将大幅提升。但同时,Anthropic指出,大约三分之一导致线上事故的bug原本可被Claude自动审查拦截——这提示开发者应尽快将AI审查纳入常规工作流,否则可能在质量竞争中被淘汰。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
首先,Anthropic提出的“可验证暂停机制”是否会有其他实验室响应,尤其是OpenAI在几日前也发布了类似“自进化早期迹象”的博客,行业是否会形成统一的减速协议值得追踪。其次,Claude的模型迭代节奏能否维持每4个月翻倍的能力曲线,以及阿姆达尔定律是否会在组织层面重新出现瓶颈(如代码review、实验消化能力),将直接影响AI研发效率的上限。最后,若RSI趋势持续,算力供应链(芯片、能源)的瓶颈可能取代算法成为新的制约因素,这会对算力租赁价格和中小开发者的准入成本产生实质性影响。
来源:36氪 · 24小时热榜


