昊梵体育网

人类56年没解开的数学题,AI一夜破了9道 5月25日,Google DeepM

人类56年没解开的数学题,AI一夜破了9道
5月25日,Google DeepMind发布了一个叫AlphaProof Nexus的AI数学智能体,它一口气解决了9道悬而未决的Erdős开放问题。其中最难的那道,人类数学家已经啃了56年,没啃动。AI花了一夜,算力成本才几百美元。
先解释下Erdős问题是什么。保罗·埃尔德什是20世纪最伟大的数学家之一,他一生提出了上千个开放问题,悬赏金额从10美元到3000美元不等——钱不多,但能在数学圈挂上名就是至高荣誉。这些问题很多已经悬了几十年,全世界最聪明的脑袋都没搞定。
现在AI搞定了9道。证明经过Lean编译器验证,没有出错。
说几个让圈内人坐不住的细节:
第一,它不是传统意义上的"算力暴力"。 AlphaProof Nexus把大语言模型、强化学习和进化算法组合在一起用。先让大模型提出猜想方向,再用强化学习反复试错优化,最后用进化算法筛选出最优证明路径。不是算得快,是"想"得对。
第二,成本令人震惊。 一道题几百美元。人类数学家为这些问题花了几十年、几百万美元的科研经费,AI一个晚上的电费就搞定了。当然这不公平——AI站在了人类几十年积累的数学知识库之上,但成本的量级差异确实触目惊心。
第三,更深的问题来了: 数学的本质是什么?如果AI能批量生产经过形式化验证的数学证明,那人类数学家的角色是什么?提出好问题的人?还是验证AI答案的人?
DeepMind这次的信号很明确:AI for Science不是口号了,是实打实的产出。一个月前他们刚发了一日两登Nature的Gemini for Science,现在又拿出这个。
黄仁勋同一天说了句话:AI基建还要烧4万亿美元。有人觉得夸张,但看看AI正在做什么——写代码、做科研、解数学题——这个投入的回报正在变得肉眼可见。
最后一个想法:埃尔德什如果还在世,大概会对这个结果又兴奋又失落。兴奋的是他的问题终于被解了,失落的是解他问题的人不是人。但也许他会像以前一样,把悬赏金照样付出去——不管对手是碳基还是硅基。