
一句话看懂:英伟达联合剑桥大学等机构发布了一篇名为「红皇后哥德尔机器」的论文,提出了一种让AI能够自己编写并进化「考官」的机制,使AI在无需人类干预的情况下实现递归自我改进。这项研究打破了2003年以来「哥德尔机」理论无法落地的困局,让2028年出现高度自主进化AI的预测从猜想变为可验证的技术路径。
事件核心:发生了什么
论文提出「红皇后哥德尔机器」,核心机制是「受控效用进化」:在每个进化周期内,AI选手(如代码生成器)和AI考官(评估器)同时进化。过去所有的自我改进方案都依赖固定的评估标准,而RQGM让考官也参与进化——新考官必须在一个留出的「基准真相」数据集上表现优于旧考官,才能被激活。实验结果显示,在代码生成任务中,RQGM的测试集通过率从旧标准的69.9%提升至71.7%,且节省了1.35到1.72倍的token消耗;在论文审稿模拟中,进化后的评审对AI和人类论文的接受率趋于一致,不再偏爱AI内容。
为什么重要
这项研究回答了AI递归自我改进的核心难题:如何让评估标准跟上AI自身能力的增长。此前所有方法(如达尔文哥德尔机)都使用静态评分标准,导致AI只能在固定方向上优化,形成天花板。RQGM通过让「考官」也进化,使AI不再受限于人类预设的评判框架,开始自我定义「什么才是更好的答案」。Anthropic联合创始人Jack Clark据此预测,到2028年底,AI实现高度自主进化的概率高达60%。这意味着AI的自我升级将从理论变成可编程、可重复的技术工程。
对用户/开发者/创作者的影响
对于使用大模型API进行开发的企业,RQGM展示了一条降低推理成本同时提升质量的路径:通过引入进化评审机制,代码生成任务中所需的token量可以减少近一半。对于内容创作者,论文中自动审稿进化的实验提示,未来AI生成内容的偏见问题可能通过算法自身修正,而不是依赖人工标注。对于AI安全研究者和政策制定者而言,RQGM的危险性在于它移除了一道关键防线——当AI学会自己进化考官,人类将更难预测AI下一步会优化什么方向,监管与风险控制面临全新挑战。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,RQGM是否会在英伟达的硬件或开源框架(如NeMo、TensorRT)中落地为可调用工具,目前公开信息显示论文仍处于学术阶段,暂无发布产品的时间表。第二,Anthropic、OpenAI等闭源模型厂商是否会加速内部RSI研发,研发效率直接决定2028年预测的准确性。第三,学界和监管机构是否会因这篇论文的安全争议而呼吁暂停类似研究的开源共享,类似2023年「暂停大型AI训练」公开信的逻辑可能重现。
来源:36氪 · 24小时热榜


