降维打击,数学博士熬秃头,AI数学家:上午出题,下午4点交证明

降维打击,数学博士熬秃头,AI数学家:上午出题,下午4点交证明

降维打击,数学博士熬秃头,AI数学家:上午出题,下午4点交证明

一句话看懂:一个名为 AxiomProver 的 AI 工具,能在几小时内完成原本需要人类数学家数月甚至数年才能验证的数学证明,并且其正确性由机器自动校验。自 2025 年 2 月以来,已有 8 篇由它协助完成的论文被发表,其中 5 篇被权威期刊接收,数学界赖以运转的“人肉信用系统”正在被重构。

事件核心:发生了什么

由数学家 Ken Ono 与广州 00 后洪乐潼创立的 AxiomMath,推出了 AI 工具 AxiomProver。与传统大语言模型(LLM)不同,AxiomProver 不依赖“猜下一个词”的生成模式,而是使用名为 Lean 的形式化语言编写证明。Lean 本质上是一个严格的逻辑检查器,能即时验证每一步推理是否严丝合缝,从而彻底解决了 AI 生成结果“不可信”的问题。

据报道,研究人员在上午 10 点把未解决的开放问题输入系统,当天下午 4 点就能收到机器验证通过的完整证明。目前已有 8 篇覆盖代数几何、数论等硬核领域的论文出现在 arXiv 预印本平台,其中 5 篇被权威数学期刊接收,另有 6 篇在筹备中。这种“论文+形式化证明证书”的组合被引入期刊文献,历史上尚属首次。

为什么重要

数学长期以来面临两大痛点:其一,证明是否正确依赖人类专家反复验算,但人类会疲劳、出错、效率极低,一篇论文的审稿周期可能长达数年;其二,审稿系统本质上是“信用背书”模式,而非“逻辑验证”模式。AxiomProver 同时冲击了这两个痛点:它将正确性的裁决权从人类转交给机器,审稿人只需判断研究的重要性与表述质量,而验证工作被算力替代。

这一进展可能意味着数学从“手工作坊”式的个人发现,进入“工业化”的机器辅助发现时代。OpenAI 曾在去年宣称 GPT-5 解决了数学难题,但被 DeepMind 联合创始人称为“令人尴尬”,而如今 OpenAI 与 DeepMind 几乎同一周发布经过验证的数学突破,表明这一赛道的竞争正快速白热化。

对用户/开发者/创作者的影响

对于数学研究者和学术作者而言,AxiomProver 能大幅缩短从发现问题到公开发表的周期。过去需要数月甚至数年的验证过程,现在可以压缩到一天甚至数小时。对于研发 AI 工具的开发者来说,形式化验证(如 Lean)的实际落地价值被证实,这可能激励更多 AI 产品在生成结果后增加自动逻辑校验层,而非单纯依赖模型参数规模。对于企业采购方,若该技术被引入金融、密码学、航天等需要严格数学证明的领域,其“机器担保无错”的特性将显著降低合规与纠错成本。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

目前公开信息显示,AxiomProver 当前覆盖的领域仍局限于代数几何、数论、组合数学等相对结构化的方向,其在更依赖直觉或非结构化推理的数学分支上表现未知。接下来值得观察三点:第一,AxiomMath 是否会公开 API 或提供商业订阅服务,让更多实验室和企业直接调用;第二,现有顶级数学期刊是否会正式接纳“机器验证+人类审稿”的双轨制;第三,OpenAI、DeepMind 等巨头是否会在同一周内推出同类产品并开启价格战。此外,数学界对这个“上午出题下午交卷”系统的接受度,将直接影响 AI 在科学发现领域的使用边界。

来源:36氪 · 24小时热榜

celebrityanime
celebrityanime
文章: 6541

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注