
Anthropic 推出 Claude Mythos,凭借简明证明攻克 Erdős 数学猜想
一句话看懂:2026 年 5 月 26 日,Anthropic 工程师 Sholto Douglas 宣布其最新模型 Claude Mythos,通过一个“巧妙且简洁的证明”,解决了组合几何学中已有百年历史的 Erdős 单位距离猜想。这紧随 OpenAI 此前用 GPT-5.5 攻克同一问题的消息,标志着两大 AI 公司在纯数学发现领域进入直接竞争阶段。
事件核心:发生了什么
Anthropic 团队构建了一个包含多个独立 Claude Code 实例的自动化测试系统。在系统内,拥有 Mythos 权限的智能体实例负责接收问题并生成不同的求解路径,然后这些路径被汇总并分发给其他独立运行的实例进行交叉验证。数学家 Daniel Litt 评论称,Mythos 的初始结果“略逊于”OpenAI 的解决方案,但 Mythos 最终找到了与 OpenAI 相同的解题路径,并独立推导出了更具原创性的简洁证明。目前,Anthropic 已正式发布由 Opus4.7 整理的证明版本。
为什么重要
这一事件引发了关于“纯大语言模型(LLMs)”与“符号推理辅助系统”两条发展路线的行业讨论。此前,Google DeepMind 用其 AlphaProof Nexus 系统解决了九个 Erdős 问题,但由于高度依赖 Lean 形式化证明语言,引发了关于生成式 AI 领域自主推理价值的争议。相比之下,Anthropic 的 Claude Code 作为智能体框架,通过多智能体协作攻克顶尖科学难题。同时,据称一位菲尔兹奖得主证实 ChatGPT 5.5 Pro 可在两小时内自主完成博士级数学研究。这表明 AI 正从早期的“提示工程”阶段,加速迈向具备深度逻辑推理和科学探索能力的自主智能体时代。
对用户/开发者/创作者的影响
对于开发者和 AI 研究者而言,这一进展意味着智能体协作框架(如 Claude Code)正展现出解决复杂推理问题的实用价值。开发者可以利用此类框架构建自动化验证和推导系统,提升在算法发现、代码审查等领域的效率。对于纯内容创作者,这一变化意味着 AI 的辅助能力正从简单的文本生成扩展至需要严谨逻辑和创造力的“发现”任务。不过,这些高级能力的实际部署通常需要企业级 API 或专用计算资源,目前公开信息显示其普及门槛仍然较高。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
1. Anthropic 是否会将 Claude Mythos 的能力集成到其面向开发者的 API 中,以及定价策略有何变化。2. OpenAI 和 Google DeepMind 是否会发布各自的对比验证结果,推动数学证明标准化的公开讨论。3. 多智能体协作框架(如 Claude Code)是否会在更广泛的科学发现任务(如药物分子设计、材料科学)中涌现新应用。
来源:AIbase
![[V2EX] 请问大家没有用 AI 开发的流程规范文档](https://www.chat-gpts.plus/wp-content/uploads/2026/05/ai_cover_5-719-768x403.jpg)

