Anthropic全球警告，OpenAI已跨“可靠性阈值”：AI自我加速启动

一句话看懂：Anthropic因担心AI加速自我迭代而公开呼吁全球暂停研究，同时OpenAI后训练团队负责人Yann Dubois披露，OpenAI自2024年12月左右已跨过“可靠性阈值”，这意味着AI正从“玩具”转变为可托付工作的“员工”，并开始反哺自身的研发进程。

事件核心：发生了什么

Anthropic内部数据显示，AI正在加速AI自身的发展，通往递归自我改进的路径可能已经出现，这一进程比预期更快，因此Anthropic呼吁减缓或暂停AI研究。与此同时，OpenAI后训练团队负责人Yann Dubois在一次访谈中给出了一个更微观的视角：AI能力增长虽然是线性的，但用户体验到的“有用性”是跳跃的，关键就在于“可靠性阈值”。Dubois判断，OpenAI大约在2024年12月跨过了这个阈值。跨过之后，AI不仅在编程场景中大幅提升了研究人员的效率——Anthropic内部数据显示，到2026年第二季度，人均每个季度贡献的代码量已是2024年第一季度的8倍——而且通过强化学习（RL）的进化，模型开始从刷题选手向职场打工人转变，优化目标从“有标准答案的题”转向“用户觉得真有用的东西”。

为什么重要

这一事件揭示了当前AI行业的核心矛盾：技术正进入“自我加速”的循环，而安全性评估可能跟不上。Anthropic的警告和OpenAI的实践形成了鲜明对比。前者从全局安全角度出发，后者则从工程落地角度确认了“临界点”已过。Dubois提出的“AI构建更像手艺而非科学”的观点，挑战了行业对“硬核算力决定一切”的认知，暗示在可靠性提升过程中，经验、直觉和反复试错（类似炼金术）同样关键。此外，他还指出，如果现在冻结所有模型，只靠打磨垂直应用（Harness），许多领域已经能让人感受到通用人工智能（AGI）的味道——这意味着瓶颈不在模型本身，而在“权限、连接和数据”这最后一公里。

对用户/开发者/创作者的影响

对于普通用户，这意味着AI工具在更多任务上变得可靠，可以放心委托，例如写代码、处理文档、协助决策，但需要留意长期运行中可能累积的错误。对于开发者，这是一个明确的信号：模型的能力天花板在短期内被拉高，做垂直应用（Harness）仍有巨大空间，尤其是打通数据、权限和业务流程这些“苦活累活”，反而可能是最有价值的金矿。但对于只想“套壳”的开发者，风险在于模型本身会持续变强，Harness需要不断重调，通用型Harness的长期稳定性存疑。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，OpenAI是否会因可靠性提升而大规模开放API权限，降低开发者接入成本？第二，Anthropic的呼吁是否能转化为实际的政策或行业自律行动，例如更严格的模型发布审查？第三，Yann Dubois提到的“持续学习”难题——AI入职后不会像人类一样不断学习——是否会成为下一轮模型竞争的关键战场，催生新的技术路线或创业机会？目前公开信息显示，行业尚未就如何安全地管理这一自我加速进程达成共识。

来源：36氪 · 24小时热榜

Anthropic全球警告，OpenAI已跨“可靠性阈值”：AI自我加速启动