「震惊!震惊!」  

        到底是什么事,能让图灵奖得主、《计算机程序设计艺术》作者、计算机科学泰斗高德纳(Donald Knuth) 接连发出如此惊叹?答案只有一个:AI

  在斯坦福大学官网最新发布的论文《Claude’s Cycles》里,高德纳直接把 **Shock! Shock!** 放在开篇,毫不掩饰自己被 AI 能力震撼的心情。他随即写道:「我昨天才得知,我钻研了好几周的一道开放难题,竟然被Claude Opus 4.6直接解出来了!这是 Anthropic 仅仅三周前才发布的混合推理模型。看来我必须重新审视我对『生成式 AI』的看法了。它不仅漂亮地解决了我的猜想,更标志着自动推理与创造性问题解决的巨大进步,这真的太让人振奋了。」 

 

论文地址:https://cs.stanford.edu/~knuth/papers/claude-cycles.pdf

  这件事立刻引爆科技圈,网友纷纷感慨 AI 正式走进硬核数学科研的时代来了 。Hacker News 用户 Ian Danforth 还给出了极简总结:高德纳提出难题,他的朋友在精细指导下,让 Claude 进行了30 多次探索 ,最终 Claude 写出 Python 程序,成功解决所有奇数的情况;高德纳亲自补上严谨证明,对 AI 的贡献非常认可。而偶数情况至今仍是未解之谜,Claude 在这部分没能突破。

难住算法泰斗的硬核图论难题

  这道题诞生于高德纳撰写《计算机程序设计艺术》未来卷、讲解有向哈密顿环的过程中,属于实打实的开放数学难题。  简单说:研究一个有 m³ 个顶点的有向图,顶点记为 ijk(0≤i,j,k<m),每个顶点有三条出弧,分别指向 i⁺jk、ij⁺k、ijk⁺(+ 表示模 m 加 1)。目标是找到**通用方法**,把这些弧拆成**三条长度为 m³ 的有向环**,且对所有 m>2 都成立。

  高德纳自己已经解决 m=3 的情况,并把它写成书中习题;他的朋友 Filip Stappers 又通过实验找到 4≤m≤16 的解,基本坐实通解存在。为了找到普适构造,Stappers 把原题完整交给了 Claude。

31 轮严谨探索:AI 一步步啃下硬骨头

  交互过程中,Stappers 给 Claude 定了非常严格的规则:  

                1. 每跑完一段测试代码,必须立刻更新 plan.md 记录思路;  

                2. 记录没写完,绝对不允许开始下一轮探索。

  Claude 全程展现出 极强的策略调整能力

  一开始尝试线性、二次函数,失败;

  再试暴力深度优先搜索,因空间太大放弃;

  随后用上「2D 蛇形分析」,还精准识别出这是带两个生成元的凯莱图(Cayley digraph)。

  真正的突破集中在后半段:

  - 第 15 次探索:引入 纤维分解 框架,把问题转化为坐标算子的排列组合;

  - 第 25 次探索:自主判断模拟退火只能找特例、不能给通解 ,必须回归纯数学推导;

  - 第 31 次探索:发现每个纤维的选择只依赖单个坐标,直接给出 Python 构造程序,完美解决 m=3、5、7、9、11 等所有奇数情况。

高德纳严谨证明收官,偶数域依然是难题

  拿到程序后,Stappers 验证了 3~101 所有奇数 m,全部成立。随后高德纳亲自完成数学证明,严格证明出 AI 构造的环确实是长度为 m³ 的哈密顿环。

  高德纳后续还发现:在同类分解方法里,== 恰好有 760 种对所有奇数 m>1 都成立 ==,而 Claude 仅凭自主推理,就精准找到了其中一种。

  但偶数 m 至今仍是悬案

  - Claude 只零星找到 m=4、6、8 的解,没发现通用规律;

  - 被要求继续攻克偶数时,甚至无法写出正确的探索代码;

  - 另有研究者用 gpt-5.3-codex 实现了大偶数(最高 m=2000)的代码,但结构过于复杂,人工证明难度极高

  在 Hacker News、Reddit 等社区,大家一致认为:这件事最有价值的不是「AI 解出一道题」,而是 **==AI 能自主换工具、排除无效思路、做出关键策略判断 ==**,真正成为数学研究的合作者。

  就像高德纳在文末感叹:克劳德・香农(Claude Shannon)在天之灵,若看到自己的名字和这样的进步相连,一定会无比骄傲。

 ==Hats off to Claude!==

AI 杀入数学殿堂:从竞赛夺金到前沿科研

  高德纳的震惊绝非个例。最近一年多,AI 在数学与逻辑领域已经实现 **== 一连串里程碑式突破 ==**:

  - 国际奥数达金牌水平:2025 年 7 月,Google DeepMind Gemini(Deep Think)在 IMO 评测中拿到 35 分金牌成绩,可输出完整自然语言证明;

  - 编程竞赛逼近人类顶尖:2025 年 9 月,OpenAI、Gemini 均宣称达到 ICPC 金牌水准,能在限时内解决高难度算法题;

  - 从解题变成科研搭档:GPT-5.2 等模型已能借助外部工具,协助数学家攻克 Erdős 猜想等多年悬案,并得到陶哲轩等学者验证。

  背后的核心变化是:现在的 AI 不再依赖「一次性快速生成」,而是用上 **== 测试时计算扩展 / 慢思考 ==**,用更多算力并行探索、自我校验,推理质量大幅提升。

  放眼未来,AI 与数学的结合,必将走出标准化考题,成为数学家、工程师身边 **== 最强科研搭档 ==**,和人类一起攻克那些停滞多年的世界级难题。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐