
OpenAI 模型反驳了离散几何的中心猜想
一句话看懂:Hackernews 社区围绕 OpenAI 模型在一次离散几何猜想验证中的表现展开讨论,核心争议在于:大模型究竟是“插值已有知识”还是能够进行“真正的新发现”。这场讨论直指 AI 是否具备独立创新能力的本质问题,对理解当前大模型的能力边界至关重要。
事件核心:发生了什么
素材源自 Hackernews 上的一则讨论帖,主题是 OpenAI 模型在离散几何领域的一个中心猜想中给出了反驳性结果。讨论者将人类知识比作高维空间中的离散点集,大模型在由这些点构成的凸包(convex hull)内插值,能够生成“尚未被发现但本质上仍属于已知范畴”的新点——这类发现对应了大多数实用型数学定理和诺贝尔奖级成果。而凸包之外的“真正跃迁”,比如从牛顿力学独立推导出广义相对论,则被普遍认为现有大模型难以实现。帖子中引用 DeepMind 创始人 Demis Hassabis 的观点:如果训练一个知识截止于 1915 年之前的 AI,再用人造卫星轨道数据测试其能否独立推导出广义相对论,那才是评判 AGI 的真正标尺。
为什么重要
这一争论并非学术游戏,而是直接戳中 AI 行业当前的核心焦虑:大模型究竟是在“组合已知”还是“发明未知”?如果仅仅是前者,那么即使模型能够解出复杂数学猜想,也无法证明其具备人类的创造能力;如果是后者,则可能改写我们对 AGI 的判断标准。OpenAI 此次的结果本身并未公布完整论文或实验细节,但社区讨论揭示了一个行业共识:目前所有大模型(包括 GPT-4、Claude 等)在数学推理上仍高度依赖训练数据中的既有模式。任何宣称 AI 能够“独立发现”新数学定理的声明,都必须经受凸包内外跃迁测试的检验。
对用户/开发者/创作者的影响
- 数学与科研用户:大模型在凸包内部的插值能力已经足够实用,可以加速文献梳理、公式推导和辅助验证。例如,研究者可以用大模型快速验证一个猜想在已有文献中是否已被证明,或将多个孤立结论进行组合推理。但不要期待模型能产生“范式级创新”。
- AI 开发者:构建推理型 AI 产品时,应区分“已知知识重组”与“未知知识发现”两类任务。对于前一类,现有模型表现良好;后一类则需要明确的评估基准(如 Demis Hassabis 的“水星轨道测试”),以避免过度营销。
- 内容创作者与教育者:大模型在解释复杂数学概念、生成教学示例方面有巨大潜力,但需注意其解释往往建立在已有教材和论文的统计模式之上,可能遗漏那些尚未被人类发现的关键连接。
值得关注的后续
- OpenAI 是否会公开完整实验细节?目前素材仅来自社区讨论,未披露具体模型版本、训练数据范围或猜想名称。若 OpenAI 发布论文,应重点关注其是否使用了 1915 年之后的数据——这对结论的可靠性至关重要。
- 针对“凸包外跃迁”的基准测试是否会诞生?Demis Hassabis 的提议若被机构采纳,可能催生一套专门评估大模型“真正创新能力”的测试集,这将对业内大量 AI 能力宣称形成检验压力。
- 数学社区是否会跟进验证?如果该猜想的反驳确实成立且模型提供完整证明,可能引发数学界对 AI 作为“合作发现者”角色的大规模讨论,甚至影响菲尔兹奖等荣誉的评选逻辑(正如讨论中戏称“许多菲尔兹奖得主可能需退回奖牌”)。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
来源:hackernews


