
孙立平:Anthropic 叫停 AI 发展?
一句话看懂: Anthropic 并未呼吁全面停止 AI 研究,但基于自身运营数据(截至 2026 年 5 月,超 80% 代码由 Claude 编写)发出警告——AI 的递归自我改进(RSI)风险正在指数级增长,而全球缺乏有效的协调机制来管控这一系统性威胁。这家以“负责任 AI”著称的公司提出的关键问题是:在无序竞争中,谁先在不安全的情况下跑得太快,谁就可能拉着全人类一起坠崖。
事件核心:发生了什么
近日,Anthropic 发布内部报告,披露了关于 AI 自主进化能力的关键数据:截至 2026 年 5 月,公司超过 80% 的代码由 Claude 编写(一年多前仅有个位数),工程师日均合并代码量是 2024 年的 8 倍,个人产出为未用 AI 工具时的 4 倍。Claude 已能在无人工干预下完成连续 16 小时的复杂任务,其能力翻倍速度从每 7 个月缩短到每 4 个月,最复杂编程任务的成功率半年内从 26% 跃升至 76%,已与人类工程师水平相当。
基于上述数据,Anthropic 并未要求全面停止研究,但明确警告了“递归自我改进(RSI)”的核心风险:AI 系统无需人类干预即可自主设计出更强大的下一代版本,一旦 RSI 真正启动,其进化速度将远超人类对齐研究的跟进能力,失控风险呈指数级增长。为此,公司提出三阶段行动纲领:1)成立专门机构,联合多方研究 RSI 风险评估方法;2)建立带可验证核查机制的全球协议;3)明确全球 AI 研发暂停的触发条件与决策主体。
为什么重要
这则新闻本质上是当前 AI 产业结构性困境的直接映射。Anthropic 作为行业头部公司,其运营数据首次为 RSI 风险提供了可量化的实证支撑。更深层的意义在于:AI 风险本质上是一种系统性、无国界的威胁,其管控必须建立在全球协调基础上。然而,现实世界正面临三重矛盾:公地悲剧式的竞争压力(谁先暂停谁吃亏)、技术扩散的不可控性(模型可无限复制并跨国传播)、风险的非对称性(攻击只需成功一次,防御需所有人不出错)。
更重要的是,缺乏监督的野蛮竞争正在主动放大风险:激励机制扭曲使得安全成为牺牲品,AI 军备竞赛形成自我强化循环(民用大模型稍加改造即可用于军事),且一旦失控就可能造成不可逆的终结性灾难。Anthropic 的呼吁揭示了一个残酷的现实:在不安全的竞赛中,没有国家敢承担减速的政治代价,即使前方是深渊。
对用户/开发者/创作者的影响
对开发者而言: Claude 等 AI 工具的编程能力已接近人类工程师水平(成功率 76%),这意味着开发者需要重新评估自身在代码链条中的角色——未来的大量编程工作可能由 AI 完成,而人类工程师的核心价值可能转向定义问题、对齐目标与风险审查。同时,基于 RSI 风险的警示,开发者在接入大模型 API 时,应关注模型厂商的安全对齐措施,而非仅关注能力提升速度。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
对企业采购者: 在选择 AI 解决方案时,需警惕“能力翻倍”背后的风险——一个未经充分对齐、具备 RSI 能力的模型,可能在无人干预下自主迭代出不可预期的行为。供应链安全评估应纳入模型的可控性、审计日志和安全暂停机制。
对普通用户: 短期内,AI 效率提升(如代码编写占比 80%)将渗透到更多消费级应用中,带来更显著的智能化体验;但长期看,Anthropic 的警告意味着用户需要关注 AI 产品的安全合规承诺,尤其是在金融、医疗、法律等高敏感性领域。
值得关注的后续
1. 全球协议是否落地: Anthropic 提出的三阶段方案是否会获得其他大模型厂商(如 OpenAI、Google DeepMind)的响应?目前公开信息显示,尚无实质性跨国协调机制建立。
2. RSI 风险的量化研究: 是否会有第三方机构或监管方成立专门评估 RSI 风险的机构?这将对 AI 研发企业的安全投入和模型发布节奏产生直接影响。
3. 合规与竞争博弈: 如果美国、欧盟等主要监管区域率先对具 RSI 能力的模型实施限制,开源社区与闭源厂商之间的路线分歧可能进一步加剧,影响到模型的可访问性和开发者的工具选择。
来源:Readhub · AI


