大家好,这里是最佳拍档,我是大飞 5月20日,OpenAI发表了一篇论文 说他们内部的一个通用模型 居然自己解决了一个困扰了数学家将近80年的难题 这个问题叫平面单位距离问题 是保罗·埃尔德什(Paul Erdős)在1946年提出来的 简单来说 如果我们在平面上随机放n个点 最多能有多少对点之间的距离刚好是1呢?

这个单位距离问题 在组合几何领域应该算是最有名的问题之一了 2005年有一本书叫《离散几何研究问题》, 作者是布拉斯(Brass)、莫泽(Moser)和帕奇(Pach) 书里直接说 这可能是组合几何中最有名 也是最简单可以解释的问题 普林斯顿大学的诺加·阿隆(Noga Alon)

他是组合数学领域的顶尖专家 也说这是埃尔德什最喜欢的问题之一 埃尔德什是20世纪最伟大的数学家之一 发表的论文数量估计是历史上最多的 而且他特别喜欢悬赏问题 经常拿出自己的钱来奖励解决难题的人

这么多年来,大家都普遍认为 把点排成方格网,然后缩放一下 就差不多是最优的构造了 这种构造能得到的单位距离对数量 大概是n的1加C除以loglogn次方 那个C是个常数 因为loglogn增长特别慢 所以这个指数其实差不多就是1 也就是说,只比线性增长快一点点 而且大家还猜想 应该没有更好的构造了

最多就是n的1加小o次方 其中的小o是说一个随着n增大趋向于0的项 而现在 OpenAI的这个模型直接把这个猜想给推翻了 他们构造出了无穷多的例子 能得到至少n的1加δ次方个单位距离对 δ是一个大于0的固定常数 最早的AI证明没有给出具体的δ值 但是后来普林斯顿的威尔·索温(Will

Sawin)做了一个改进 说可以取δ等于0.014 这个结果为什么让数学界震撼呢?

让我来讲讲这个问题的历史 你就明白了 这个问题最好的下界 也就是最多能有多少单位距离对 从埃尔德什1946年的原始构造开始

基本上就没怎么变过 而最好的上界呢 是斯潘塞(Spencer)、塞迈雷迪(Szemerédi)和特罗特(Trotter)在1984年做出来的 是O(n的4/3次方), 后来虽然有一些细化和相关的结构工作 但是上界也基本没变过 而且还有证据支持原来的猜想

马图谢克(Matoušek)还有阿隆-布希奇-绍尔曼(Alon-Bucić-Sauermann)研究了平面上的非欧距离 证明了大多数非欧距离在某种意义上 都符合那个猜想 所以大家真的都觉得 原来的猜想应该是对的 更有意思的是 这个证明用的关键工具 居然来自一个完全不同的数学领域 叫代数数论

这个领域研究的是代数数域里的分解 也就是整数的推广 比如说高斯整数,就是a加bi的形式 其中a和b是整数,i是虚数单位 埃尔德什原来的下界 其实就是用高斯整数来理解的 高斯整数有像唯一分解成素数这样的性质 新的论证呢

把高斯整数换成了代数数论里更复杂的推广形式 这些推广形式有更丰富的对称性 能创造出多得多的单位长度差 具体的论证用到了无限类域塔(infinite class field towers)和戈洛德-沙法列维奇定理(Golod-Shafarevich theory) 来证明论证需要的数域确实存在

这些思想在代数数论家里是众所周知的 但是没人想到它们居然和欧几里得平面上的几何问题有关系 这真的是一个非常意外的联系 说真的,我第一次看到这个的时候 整个人都愣了一下 不是说AI又能做什么数学题了 而是这次的方式不一样 这个证明不是来自一个专门训练来做数学的模型 也不是搭了一个搜索证明策略的架子

更不是专门针对这个单位距离问题的 这就是一个通用的推理模型 在测试它能不能做前沿研究的时候 刚好试了一堆埃尔德什的问题 结果它自己找到了一个这么难的问题的解法 而且用的还是一个大家完全没想到的领域里的工具

这就好比你让一个学画画的朋友帮你修电脑 结果他不仅修好了 还顺便给你写了一个新的操作系统 目前这个证明已经通过了外部数学家的检查 他们还写了一篇配套的论文 解释了论证 给这个结果的意义提供了更多背景和上下文 菲尔兹奖得主蒂莫西·高尔斯(Tim Gowers)在配套论文里说 这是AI数学里的里程碑

如果是人写了这篇论文投给《数学年刊》, 让他快速给个意见 他会毫不犹豫地推荐录用 之前AI生成的证明没有一个接近这个水平的 顶尖数论学者阿鲁尔·尚卡尔(Arul Shankar)说 他认为这篇论文证明了现在的AI模型不仅仅是人类数学家的助手 它们有能力有独创的巧妙想法 并且把这些想法实现出来

模型的思维链非常有意思 值得注意的是 绝大多数想法都是在尝试构造一个反例 来打破大家普遍相信的上界 而不是尝试证明它 这说明模型有一些好的直觉 愿意尝试社区认为希望渺茫的方法 而且有尝试构造的倾向

诺加·阿隆也说 这是埃尔德什最喜欢的问题之一 他自己听过埃尔德什在课里多次提到这个问题 他认为可以公平地说 每个做组合几何的数学家都想过这个问题 很多其他领域的数学家也至少花过一点时间想它 OpenAI内部模型解决了这个问题 在他看来是一个杰出的成就 解决了一个长期悬而未决的问题

而且正确答案不是n的1加小o次方 这很令人惊讶 虽然构造和分析用了代数数论里相当复杂的工具 但是用得很优雅、很巧妙 雅各布·齐默尔曼(Jacob Tsimerman)则说 这真是一篇令人印象深刻的工作 他会毫不犹豫地为任何期刊接受它 他自己其实短暂地做过这个问题 也尝试构造过反例 但是没取得什么进展

你听听这几位的评价 每一个都是数学界响当当的人物 尤其是高尔斯,他是菲尔兹奖得主 能让他这么说的工作,真的不多 这个结果为什么对数学这么重要呢?

因为它不只是解决了一个难题 而是标志着AI和数学互动进入了一个重要时刻

让我们看到了AI和人类数学家之间一种新的合作方式 在这个例子里 外部数学家的配套工作 比单独的原始解决方案要丰富得多 托马斯·布鲁姆(Thomas Bloom)在配套注释里写 当评估AI生成的证明的重要性和影响时 他问了自己的一个问题是 这教给了我们关于这个问题的新知识吗?现在我们对离散几何更了解了吗?

他认为答案是有保留的肯定 这说明数论构造对这类问题的启示 比我们之前怀疑的要多得多 而且需要的数论可能非常深 毫无疑问,未来几个月 很多代数数论专家会仔细看看离散几何里的其他开放问题 我们会在数学很多其他领域看到类似的成功 通过AI揭示出意外的联系 把现有的技术机器推到极限

从而解决长期悬而未决的问题 AI正在帮助我们更完整地探索 我们几个世纪以来建造的数学大教堂 那么,还有什么其他看不见的奇迹 在等待着我们呢?

这个结果最特别的就是 它不只是解决了一个特定的猜想

而是给数学家提供了一座桥梁 让他们开始探索更多相关的问题 所以说 那个代数数论和离散几何之间的意外联系 才是这个结果最值得注意的地方 其实这个事情的意义 远不止于这一个数学题 更好的数学推理能力 能让AI成为更强的研究伙伴 它能把困难的思路串起来 把知识里很远的领域的想法连起来

找出专家可能没有优先考虑的、有希望的路径 帮助研究者在那些原本太复杂或者太耗时的问题上取得进展 这些能力的重要性不止在数学里 如果一个模型能让复杂的论证保持连贯 把知识里很远的领域的想法连起来 产出能通过专家检查的工作 这些能力在生物、物理、材料科学、工程、医学里也都是有用的

也是我们长期走向更多自动化研究的一部分 AI系统能够帮助科学家和工程师们探索更多的想法 追求更难的技术问题 最重要的是AI研究本身 虽然这个进展不是意料之外的 但是它增强了我们感受到的紧迫感 要理解这个AI发展的下一阶段

对齐非常智能系统的挑战 还有人类和AI合作的未来 很多朋友会觉得 这不就是AI又解了一道数学题吗?之前不也有过吗?应该说,之前的AI做数学 很多时候是在已知的方法里找 或者是在一些特定的领域里 但是这次不一样 这次它用的是完全不同领域的工具 把代数数论里的东西用到了离散几何上 这是所有人都没想到的

这说明它不只是在重复已有的知识 而是真的在做一些创造性的连接 把看起来不相关的东西串起来了 这种跨领域的联想 其实很多时候就是数学里重大突破的来源 很多重要的数学结果 都是把两个看起来没关系的领域连起来了 而且更重要的是 这个模型不是专门做数学的 这就意味着,这种能力可能是通用的

可能在其他领域也会出现类似的事情 比如明天它用高能物理的方法来解决一个生物学问题 后天用拓扑学的方法来解决一个计算机科学问题 这才是最让人兴奋 也最让人有点不安的地方 说真的,我有时候在想

AI现在发展的速度真的有点快得离谱 几年前大家还在争论AI能不能理解上下文 现在它已经开始自己解决几十年的数学难题了 而且用的还是那么巧妙的方法 完全跳出了大家的思维定式 不过有一点我还是相信的 布鲁姆最后那句话说得特别对 未来还是取决于人类的判断 专业知识会变得更有价值 而不是更少

AI可以帮着搜索、建议和验证 但是选择什么问题重要 怎么解读结果,接下来追求什么问题 还是得由人来做 这次这个事情也是这样 AI找到了证明 但还是需要人类数学家来检查 来写配套论文,来解释它的意义 来把这个发现更好地融入整个数学体系里 这不是替代,而是一种新的合作方式 我有时候会觉得

我们现在可能真的站在一个新时代的门槛上 就像几百年前望远镜刚发明的时候 或者计算机刚出现的时候 你知道有什么重要的事情正在发生 但是你还不完全清楚它会带来什么 未来会怎么样?

我不知道 但是我觉得至少有一点可以肯定

就是AI会越来越多地参与到创造性的工作里 不只是执行,而是开始探索和发现 而我们要做的 可能就是学会和它一起工作 找到最好的方式来利用这种能力 同时不失去我们自己的判断力和创造力