孙立平：Anthropic 叫停 AI 发展？

一句话看懂： Anthropic 并未呼吁全面停止 AI 研究，但基于自身运营数据（截至 2026 年 5 月，超 80% 代码由 Claude 编写）发出警告——AI 的递归自我改进（RSI）风险正在指数级增长，而全球缺乏有效的协调机制来管控这一系统性威胁。这家以“负责任 AI”著称的公司提出的关键问题是：在无序竞争中，谁先在不安全的情况下跑得太快，谁就可能拉着全人类一起坠崖。

事件核心：发生了什么

近日，Anthropic 发布内部报告，披露了关于 AI 自主进化能力的关键数据：截至 2026 年 5 月，公司超过 80% 的代码由 Claude 编写（一年多前仅有个位数），工程师日均合并代码量是 2024 年的 8 倍，个人产出为未用 AI 工具时的 4 倍。Claude 已能在无人工干预下完成连续 16 小时的复杂任务，其能力翻倍速度从每 7 个月缩短到每 4 个月，最复杂编程任务的成功率半年内从 26% 跃升至 76%，已与人类工程师水平相当。

基于上述数据，Anthropic 并未要求全面停止研究，但明确警告了“递归自我改进（RSI）”的核心风险：AI 系统无需人类干预即可自主设计出更强大的下一代版本，一旦 RSI 真正启动，其进化速度将远超人类对齐研究的跟进能力，失控风险呈指数级增长。为此，公司提出三阶段行动纲领：1）成立专门机构，联合多方研究 RSI 风险评估方法；2）建立带可验证核查机制的全球协议；3）明确全球 AI 研发暂停的触发条件与决策主体。

为什么重要

这则新闻本质上是当前 AI 产业结构性困境的直接映射。Anthropic 作为行业头部公司，其运营数据首次为 RSI 风险提供了可量化的实证支撑。更深层的意义在于：AI 风险本质上是一种系统性、无国界的威胁，其管控必须建立在全球协调基础上。然而，现实世界正面临三重矛盾：公地悲剧式的竞争压力（谁先暂停谁吃亏）、技术扩散的不可控性（模型可无限复制并跨国传播）、风险的非对称性（攻击只需成功一次，防御需所有人不出错）。

更重要的是，缺乏监督的野蛮竞争正在主动放大风险：激励机制扭曲使得安全成为牺牲品，AI 军备竞赛形成自我强化循环（民用大模型稍加改造即可用于军事），且一旦失控就可能造成不可逆的终结性灾难。Anthropic 的呼吁揭示了一个残酷的现实：在不安全的竞赛中，没有国家敢承担减速的政治代价，即使前方是深渊。

对用户/开发者/创作者的影响

对开发者而言： Claude 等 AI 工具的编程能力已接近人类工程师水平（成功率 76%），这意味着开发者需要重新评估自身在代码链条中的角色——未来的大量编程工作可能由 AI 完成，而人类工程师的核心价值可能转向定义问题、对齐目标与风险审查。同时，基于 RSI 风险的警示，开发者在接入大模型 API 时，应关注模型厂商的安全对齐措施，而非仅关注能力提升速度。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

对企业采购者： 在选择 AI 解决方案时，需警惕“能力翻倍”背后的风险——一个未经充分对齐、具备 RSI 能力的模型，可能在无人干预下自主迭代出不可预期的行为。供应链安全评估应纳入模型的可控性、审计日志和安全暂停机制。

对普通用户： 短期内，AI 效率提升（如代码编写占比 80%）将渗透到更多消费级应用中，带来更显著的智能化体验；但长期看，Anthropic 的警告意味着用户需要关注 AI 产品的安全合规承诺，尤其是在金融、医疗、法律等高敏感性领域。

值得关注的后续

1. 全球协议是否落地： Anthropic 提出的三阶段方案是否会获得其他大模型厂商（如 OpenAI、Google DeepMind）的响应？目前公开信息显示，尚无实质性跨国协调机制建立。

2. RSI 风险的量化研究： 是否会有第三方机构或监管方成立专门评估 RSI 风险的机构？这将对 AI 研发企业的安全投入和模型发布节奏产生直接影响。

3. 合规与竞争博弈： 如果美国、欧盟等主要监管区域率先对具 RSI 能力的模型实施限制，开源社区与闭源厂商之间的路线分歧可能进一步加剧，影响到模型的可访问性和开发者的工具选择。

来源：Readhub · AI

孙立平：Anthropic 叫停 AI 发展？