OpenAI内部模型攻克80年数学难题 | 平面单位距离问题 | Paul Erdős | 用代数数论解决平面几何问题 | 菲尔兹奖得主评价

大家好，这里是最佳拍档，我是大飞 5月20日，OpenAI发表了一篇论文说他们内部的一个通用模型居然自己解决了一个困扰了数学家将近80年的难题这个问题叫平面单位距离问题是保罗·埃尔德什（Paul Erdős）在1946年提出来的简单来说如果我们在平面上随机放n个点最多能有多少对点之间的距离刚好是1呢？

这个单位距离问题在组合几何领域应该算是最有名的问题之一了 2005年有一本书叫《离散几何研究问题》，作者是布拉斯（Brass）、莫泽（Moser）和帕奇（Pach）书里直接说这可能是组合几何中最有名也是最简单可以解释的问题普林斯顿大学的诺加·阿隆（Noga Alon）

他是组合数学领域的顶尖专家也说这是埃尔德什最喜欢的问题之一埃尔德什是20世纪最伟大的数学家之一发表的论文数量估计是历史上最多的而且他特别喜欢悬赏问题经常拿出自己的钱来奖励解决难题的人

这么多年来，大家都普遍认为把点排成方格网，然后缩放一下就差不多是最优的构造了这种构造能得到的单位距离对数量大概是n的1加C除以loglogn次方那个C是个常数因为loglogn增长特别慢所以这个指数其实差不多就是1 也就是说，只比线性增长快一点点而且大家还猜想应该没有更好的构造了

最多就是n的1加小o次方其中的小o是说一个随着n增大趋向于0的项而现在 OpenAI的这个模型直接把这个猜想给推翻了他们构造出了无穷多的例子能得到至少n的1加δ次方个单位距离对 δ是一个大于0的固定常数最早的AI证明没有给出具体的δ值但是后来普林斯顿的威尔·索温（Will

Sawin）做了一个改进说可以取δ等于0.014 这个结果为什么让数学界震撼呢？

让我来讲讲这个问题的历史你就明白了这个问题最好的下界也就是最多能有多少单位距离对从埃尔德什1946年的原始构造开始

基本上就没怎么变过而最好的上界呢是斯潘塞（Spencer）、塞迈雷迪（Szemerédi）和特罗特（Trotter）在1984年做出来的是O(n的4/3次方)，后来虽然有一些细化和相关的结构工作但是上界也基本没变过而且还有证据支持原来的猜想

马图谢克（Matoušek）还有阿隆-布希奇-绍尔曼（Alon-Bucić-Sauermann）研究了平面上的非欧距离证明了大多数非欧距离在某种意义上都符合那个猜想所以大家真的都觉得原来的猜想应该是对的更有意思的是这个证明用的关键工具居然来自一个完全不同的数学领域叫代数数论

这个领域研究的是代数数域里的分解也就是整数的推广比如说高斯整数，就是a加bi的形式其中a和b是整数，i是虚数单位埃尔德什原来的下界其实就是用高斯整数来理解的高斯整数有像唯一分解成素数这样的性质新的论证呢

把高斯整数换成了代数数论里更复杂的推广形式这些推广形式有更丰富的对称性能创造出多得多的单位长度差具体的论证用到了无限类域塔（infinite class field towers）和戈洛德-沙法列维奇定理（Golod-Shafarevich theory）来证明论证需要的数域确实存在

这些思想在代数数论家里是众所周知的但是没人想到它们居然和欧几里得平面上的几何问题有关系这真的是一个非常意外的联系说真的，我第一次看到这个的时候整个人都愣了一下不是说AI又能做什么数学题了而是这次的方式不一样这个证明不是来自一个专门训练来做数学的模型也不是搭了一个搜索证明策略的架子

更不是专门针对这个单位距离问题的这就是一个通用的推理模型在测试它能不能做前沿研究的时候刚好试了一堆埃尔德什的问题结果它自己找到了一个这么难的问题的解法而且用的还是一个大家完全没想到的领域里的工具

这就好比你让一个学画画的朋友帮你修电脑结果他不仅修好了还顺便给你写了一个新的操作系统目前这个证明已经通过了外部数学家的检查他们还写了一篇配套的论文解释了论证给这个结果的意义提供了更多背景和上下文菲尔兹奖得主蒂莫西·高尔斯（Tim Gowers）在配套论文里说这是AI数学里的里程碑

如果是人写了这篇论文投给《数学年刊》，让他快速给个意见他会毫不犹豫地推荐录用之前AI生成的证明没有一个接近这个水平的顶尖数论学者阿鲁尔·尚卡尔（Arul Shankar）说他认为这篇论文证明了现在的AI模型不仅仅是人类数学家的助手它们有能力有独创的巧妙想法并且把这些想法实现出来

模型的思维链非常有意思值得注意的是绝大多数想法都是在尝试构造一个反例来打破大家普遍相信的上界而不是尝试证明它这说明模型有一些好的直觉愿意尝试社区认为希望渺茫的方法而且有尝试构造的倾向

诺加·阿隆也说这是埃尔德什最喜欢的问题之一他自己听过埃尔德什在课里多次提到这个问题他认为可以公平地说每个做组合几何的数学家都想过这个问题很多其他领域的数学家也至少花过一点时间想它 OpenAI内部模型解决了这个问题在他看来是一个杰出的成就解决了一个长期悬而未决的问题

而且正确答案不是n的1加小o次方这很令人惊讶虽然构造和分析用了代数数论里相当复杂的工具但是用得很优雅、很巧妙雅各布·齐默尔曼（Jacob Tsimerman）则说这真是一篇令人印象深刻的工作他会毫不犹豫地为任何期刊接受它他自己其实短暂地做过这个问题也尝试构造过反例但是没取得什么进展

你听听这几位的评价每一个都是数学界响当当的人物尤其是高尔斯，他是菲尔兹奖得主能让他这么说的工作，真的不多这个结果为什么对数学这么重要呢？

因为它不只是解决了一个难题而是标志着AI和数学互动进入了一个重要时刻

让我们看到了AI和人类数学家之间一种新的合作方式在这个例子里外部数学家的配套工作比单独的原始解决方案要丰富得多托马斯·布鲁姆（Thomas Bloom）在配套注释里写当评估AI生成的证明的重要性和影响时他问了自己的一个问题是这教给了我们关于这个问题的新知识吗？现在我们对离散几何更了解了吗？

他认为答案是有保留的肯定这说明数论构造对这类问题的启示比我们之前怀疑的要多得多而且需要的数论可能非常深毫无疑问，未来几个月很多代数数论专家会仔细看看离散几何里的其他开放问题我们会在数学很多其他领域看到类似的成功通过AI揭示出意外的联系把现有的技术机器推到极限

从而解决长期悬而未决的问题 AI正在帮助我们更完整地探索我们几个世纪以来建造的数学大教堂那么，还有什么其他看不见的奇迹在等待着我们呢？

这个结果最特别的就是它不只是解决了一个特定的猜想

而是给数学家提供了一座桥梁让他们开始探索更多相关的问题所以说那个代数数论和离散几何之间的意外联系才是这个结果最值得注意的地方其实这个事情的意义远不止于这一个数学题更好的数学推理能力能让AI成为更强的研究伙伴它能把困难的思路串起来把知识里很远的领域的想法连起来

找出专家可能没有优先考虑的、有希望的路径帮助研究者在那些原本太复杂或者太耗时的问题上取得进展这些能力的重要性不止在数学里如果一个模型能让复杂的论证保持连贯把知识里很远的领域的想法连起来产出能通过专家检查的工作这些能力在生物、物理、材料科学、工程、医学里也都是有用的

也是我们长期走向更多自动化研究的一部分 AI系统能够帮助科学家和工程师们探索更多的想法追求更难的技术问题最重要的是AI研究本身虽然这个进展不是意料之外的但是它增强了我们感受到的紧迫感要理解这个AI发展的下一阶段

对齐非常智能系统的挑战还有人类和AI合作的未来很多朋友会觉得这不就是AI又解了一道数学题吗？之前不也有过吗？应该说，之前的AI做数学很多时候是在已知的方法里找或者是在一些特定的领域里但是这次不一样这次它用的是完全不同领域的工具把代数数论里的东西用到了离散几何上这是所有人都没想到的

这说明它不只是在重复已有的知识而是真的在做一些创造性的连接把看起来不相关的东西串起来了这种跨领域的联想其实很多时候就是数学里重大突破的来源很多重要的数学结果都是把两个看起来没关系的领域连起来了而且更重要的是这个模型不是专门做数学的这就意味着，这种能力可能是通用的

可能在其他领域也会出现类似的事情比如明天它用高能物理的方法来解决一个生物学问题后天用拓扑学的方法来解决一个计算机科学问题这才是最让人兴奋也最让人有点不安的地方说真的，我有时候在想

AI现在发展的速度真的有点快得离谱几年前大家还在争论AI能不能理解上下文现在它已经开始自己解决几十年的数学难题了而且用的还是那么巧妙的方法完全跳出了大家的思维定式不过有一点我还是相信的布鲁姆最后那句话说得特别对未来还是取决于人类的判断专业知识会变得更有价值而不是更少

AI可以帮着搜索、建议和验证但是选择什么问题重要怎么解读结果，接下来追求什么问题还是得由人来做这次这个事情也是这样 AI找到了证明但还是需要人类数学家来检查来写配套论文，来解释它的意义来把这个发现更好地融入整个数学体系里这不是替代，而是一种新的合作方式我有时候会觉得

我们现在可能真的站在一个新时代的门槛上就像几百年前望远镜刚发明的时候或者计算机刚出现的时候你知道有什么重要的事情正在发生但是你还不完全清楚它会带来什么未来会怎么样？

我不知道但是我觉得至少有一点可以肯定

就是AI会越来越多地参与到创造性的工作里不只是执行，而是开始探索和发现而我们要做的可能就是学会和它一起工作找到最好的方式来利用这种能力同时不失去我们自己的判断力和创造力

OpenAI内部模型攻克80年数学难题 | 平面单位距离问题 | Paul Erdős | 用代数数论解决平面几何问题 | 菲尔兹奖得主评价 | AI正在帮助重建数学大教堂 · 全文文字稿