高德纳直呼「震惊！震惊！」，Claude 破解《计算机程序设计艺术》难题

AI破解高德纳数学难题震惊学界！计算机科学泰斗高德纳在最新论文中表示，自己钻研数周的图论难题被Claude Opus成功解决，并亲自为AI的解法提供了严谨证明。该研究展示了AI在数学推理上的重大突破：通过31轮严格探索，Claude自主调整策略，最终给出适用于所有奇数情况的Python构造程序。尽管偶数情况仍是未解之谜，但AI展现出的策略判断能力和创造性思维，标志着其已从解题工具进化为科研合作伙伴

2301_80716001

840人浏览 · 2026-03-05 19:58:03

2301_80716001 · 2026-03-05 19:58:03 发布

　　「震惊！震惊！」　　

到底是什么事，能让图灵奖得主、《计算机程序设计艺术》作者、计算机科学泰斗高德纳（Donald Knuth） 接连发出如此惊叹？答案只有一个：AI。

　　在斯坦福大学官网最新发布的论文《Claude’s Cycles》里，高德纳直接把 **Shock! Shock!** 放在开篇，毫不掩饰自己被 AI 能力震撼的心情。他随即写道：「我昨天才得知，我钻研了好几周的一道开放难题，竟然被Claude Opus 4.6直接解出来了！这是 Anthropic 仅仅三周前才发布的混合推理模型。看来我必须重新审视我对『生成式 AI』的看法了。它不仅漂亮地解决了我的猜想，更标志着自动推理与创造性问题解决的巨大进步，这真的太让人振奋了。」　

　

论文地址：https://cs.stanford.edu/~knuth/papers/claude-cycles.pdf

　　这件事立刻引爆科技圈，网友纷纷感慨 AI 正式走进硬核数学科研的时代来了 。Hacker News 用户 Ian Danforth 还给出了极简总结：高德纳提出难题，他的朋友在精细指导下，让 Claude 进行了30 多次探索，最终 Claude 写出 Python 程序，成功解决所有奇数的情况；高德纳亲自补上严谨证明，对 AI 的贡献非常认可。而偶数情况至今仍是未解之谜，Claude 在这部分没能突破。

难住算法泰斗的硬核图论难题

　　这道题诞生于高德纳撰写《计算机程序设计艺术》未来卷、讲解有向哈密顿环的过程中，属于实打实的开放数学难题。　　简单说：研究一个有 m³ 个顶点的有向图，顶点记为 ijk（0≤i,j,k<m），每个顶点有三条出弧，分别指向 i⁺jk、ij⁺k、ijk⁺（+ 表示模 m 加 1）。目标是找到**通用方法**，把这些弧拆成**三条长度为 m³ 的有向环**，且对所有 m>2 都成立。

　　高德纳自己已经解决 m=3 的情况，并把它写成书中习题；他的朋友 Filip Stappers 又通过实验找到 4≤m≤16 的解，基本坐实通解存在。为了找到普适构造，Stappers 把原题完整交给了 Claude。

31 轮严谨探索：AI 一步步啃下硬骨头

　　交互过程中，Stappers 给 Claude 定了非常严格的规则：　　

1. 每跑完一段测试代码，必须立刻更新 plan.md 记录思路；　　

2. 记录没写完，绝对不允许开始下一轮探索。

　　Claude 全程展现出极强的策略调整能力：

　　一开始尝试线性、二次函数，失败；

　　再试暴力深度优先搜索，因空间太大放弃；

　　随后用上「2D 蛇形分析」，还精准识别出这是带两个生成元的凯莱图（Cayley digraph）。

　　真正的突破集中在后半段：

　　- 第 15 次探索：引入纤维分解 框架，把问题转化为坐标算子的排列组合；

　　- 第 25 次探索：自主判断模拟退火只能找特例、不能给通解，必须回归纯数学推导；

　　- 第 31 次探索：发现每个纤维的选择只依赖单个坐标，直接给出 Python 构造程序，完美解决 m=3、5、7、9、11 等所有奇数情况。

高德纳严谨证明收官，偶数域依然是难题

　　拿到程序后，Stappers 验证了 3～101 所有奇数 m，全部成立。随后高德纳亲自完成数学证明，严格证明出 AI 构造的环确实是长度为 m³ 的哈密顿环。

　　高德纳后续还发现：在同类分解方法里，== 恰好有 760 种对所有奇数 m>1 都成立 ==，而 Claude 仅凭自主推理，就精准找到了其中一种。

　　但偶数 m 至今仍是悬案：

　　- Claude 只零星找到 m=4、6、8 的解，没发现通用规律；

　　- 被要求继续攻克偶数时，甚至无法写出正确的探索代码；

　　- 另有研究者用 gpt-5.3-codex 实现了大偶数（最高 m=2000）的代码，但结构过于复杂，人工证明难度极高。

　　在 Hacker News、Reddit 等社区，大家一致认为：这件事最有价值的不是「AI 解出一道题」，而是 **==AI 能自主换工具、排除无效思路、做出关键策略判断 ==**，真正成为数学研究的合作者。

　　就像高德纳在文末感叹：克劳德・香农（Claude Shannon）在天之灵，若看到自己的名字和这样的进步相连，一定会无比骄傲。

==Hats off to Claude!==

AI 杀入数学殿堂：从竞赛夺金到前沿科研

　　高德纳的震惊绝非个例。最近一年多，AI 在数学与逻辑领域已经实现 **== 一连串里程碑式突破 ==**：

　　- 国际奥数达金牌水平：2025 年 7 月，Google DeepMind Gemini（Deep Think）在 IMO 评测中拿到 35 分金牌成绩，可输出完整自然语言证明；

　　- 编程竞赛逼近人类顶尖：2025 年 9 月，OpenAI、Gemini 均宣称达到 ICPC 金牌水准，能在限时内解决高难度算法题；

　　- 从解题变成科研搭档：GPT-5.2 等模型已能借助外部工具，协助数学家攻克 Erdős 猜想等多年悬案，并得到陶哲轩等学者验证。

　　背后的核心变化是：现在的 AI 不再依赖「一次性快速生成」，而是用上 **== 测试时计算扩展 / 慢思考 ==**，用更多算力并行探索、自我校验，推理质量大幅提升。

　　放眼未来，AI 与数学的结合，必将走出标准化考题，成为数学家、工程师身边 **== 最强科研搭档 ==**，和人类一起攻克那些停滞多年的世界级难题。

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

第6周学习总结：代码执行工具 + 多工具初步整合

本周完成了代码执行工具的安全沙箱设计，并为 Agent 添加了联网搜索能力，工具集扩展至 4 个，实现了从“只说不做”到“既说又做”的能力升级。

cover

OBS直播使用教程：OBS美颜插件OBS美颜摄像头OBS美颜相机下载安装使用教程

cover

35岁+被优化？别慌！AI训练师赛道年增200%，你的经验正是“硬通货”！

所有评论(0)

查看更多评论

2301_80716001

已为社区贡献3条内容