我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

Nature重磅：击败人类数学家，AI首次攻破经典数学难题

类别：科技发布时间：2023-12-15 14:38:00 来源：学术头条

人工智能（AI）大模型，击败了人类数学家。

今天，在 Nature 上发表的一篇论文中，Google DeepMind 的研究团队介绍了一种搜索数学和计算机科学新解决方案的方法——FunSearch，它的工作原理是将预先训练的大型语言模型（LLMs）与自动“评估器”配对，从而防止幻觉和错误想法。通过在这两个组件之间来回迭代，最初的解决方案会演变成新的知识。

这项研究首次利用了 LLMs 在挑战科学或数学中的开放问题。FunSearch 发现了上限集问题的新解决方案，而这是数学中一个长期存在的开放问题。此外，为了展示 FunSearch 的实际用途，研究人员用它来发现更有效的算法来解决“装箱”问题，该问题具有无处不在的应用，例如提高数据中心的效率。

科学进步始终依赖于分享新理解的能力。FunSearch 成为特别强大的科学工具的原因在于，它输出的程序揭示了如何构建其解决方案，而不仅仅是解决方案是什么。论文作者表示，“希望这能够激发使用 FunSearch 的科学家的进一步见解，推动改进和发现的良性循环。”

威斯康星大学麦迪逊分校的合作者和数学教授 Jordan Ellenberg 表示：“FunSearch 生成的解决方案在概念上比单纯的数字列表要丰富得多。当我研究它们时，我学到了一些东西。”

发现最大上限集，解决“装箱”问题

FunSearch 采用由 LLMs 支持的进化方法，促进和开发得分最高的创意。这些想法被表达为计算机程序，以便它们可以自动运行和评估。

首先，用户以代码的形式编写问题的描述，该描述包括评估程序的过程和用于初始化程序池的种子程序。

FunSearch 是一个迭代过程。在每次迭代中，系统都会从当前的程序池中选择一些程序，并将其反馈到 LLMs。随后，LLMs 创造性地在此基础上构建，并生成新的程序，并自动评估。最好的程序将被添加回现有程序库中，从而创建一个自我改进的循环。

FunSearch 使用了 Google 的 PaLM 2，但它与其他受过代码训练的 LLMs 兼容。

图｜FunSearch 过程

研究重点关注了上限集问题，这是一项公开挑战，数十年来一直困扰着多个研究领域的数学家，著名数学家陶哲轩曾将其描述为他最喜欢的开放问题。

该问题包括在高维网格中找到最大的点集（称为上限集），其中没有三个点躺在一条线上。这个问题很重要，因为它可以作为极值组合学中其他问题的模型，研究数字、图形或其他对象的集合可以有多大或有多小。解决这个问题的强力计算方法不起作用，需要考虑的可能性数量很快就变得比宇宙中的原子数量还要多。

图｜交互式图表显示了从种子程序（上）到新的高分函数（下）的演变，每个圆圈都是一个程序，其大小与分配给它的分数成正比。

然而，FunSearch 以程序的形式在某些设置中发现了迄今为止发现的最大上限集，这是过去 20 年来上限规模最大增幅。此外，FunSearch 的性能还优于最先进的计算求解器。

此外，研究人员还将 FunSearch 应用于计算机科学中的实际挑战来探索 FunSearch 的灵活性。“装箱”问题着眼于如何将不同尺寸的物品装入最少数量的箱子中，这是许多现实世界问题的核心。

在线装箱问题通常使用基于人类经验的算法经验法则（启发式方法）来解决，但针对不同规模、时间或容量的具体方案可能难以提出。为此，FunSearch 提供了一个自动定制的程序（适应数据的具体情况），使用更少的箱子来包装相同数量的物品，性能优于既定的启发式方法。

这只是一个开始

在不同领域发现新的数学知识和算法是一项众所周知的艰巨任务，很大程度上超出了最先进的 AI 系统的能力。为了使用 FunSearch 解决此类具有挑战性的问题，该研究引入了多个关键组件。

值得一提的是，FunSearch 并不是一个仅仅生成问题解决方案的黑匣子。相反，它会生成程序来描述如何得出这些解决方案，而这种展示工作方法是科学家通常的运作方式。

FunSearch 倾向于寻找以高度紧凑的程序为代表的解决方案，具有低柯尔莫哥洛夫复杂度（low Kolmogorov complexity）的解决方案。短程序（Short programs）可以描述非常大的对象，使 FunSearch 能够扩展到大海捞针的大型问题。此外，FunSearch 的这种特点也使得其程序输出更容易让研究人员理解。

更重要的是，FunSearch 程序的这种可解释性可以为研究人员提供可行的见解。例如，当使用 FunSearch 时，它的一些高分输出的代码中存在有趣的对称性。

图｜检查 FunSearch 生成的代码产生了进一步的可操作的见解（左）；使用左侧（更短的）程序构建的原始“可接受”集（右）。

上限集问题的研究结果表明，FunSearch 技术可以超越困难组合问题的既定结果，而在这些问题上很难建立直觉。研究人员期望这种方法能够在组合学中类似理论问题的新发现中发挥作用，并在通信理论等领域开辟新的可能性。

另外，在线装箱等硬组合问题可以使用其他 AI 方法来解决，例如神经网络和强化学习。事实证明，FunSearch 的方法也有效，但也可能需要大量资源来部署。另一方面，该方法输出的代码可以轻松检查和部署，这意味着其解决方案有可能被植入到各种现实世界的工业系统中，以带来快速的效益。

FunSearch 表明，如果能够防范 LLMs 的幻觉，这些模型的力量不仅可以用来产生新的数学发现，还可以揭示对重要现实世界问题的潜在有效解决方案。

研究团队预计，对于科学和工业中的许多问题（无论是长期存在的还是新的），使用 LLMs 驱动的方法生成有效且定制的算法将成为普遍做法。

事实上，这只是一个开始。研究人员表示：“我们还将努力扩大其能力，以解决社会各种紧迫的科学和工程挑战。”

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2023-12-15 18:45:19

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于数学,数学家,重磅,难题,人类,经典的资讯：

菲尔兹奖得主亲测GPT-4o，经典过河难题破解失败！最强Cl

...的答案比正确答案呈指数级增长。（然而，这更多与它的数学能力有关，所以有点取巧。）在网友测试的一个案例中，即使被告知农夫根本不需要过河，GPT-4o仍提出了一个9次渡河的复

2024-07-01 08:58:00

AI表现直逼国际奥数优秀选手，它要 “征服”数学了吗？

...I）铺平道路？数学一直被视为人类智力的“天花板”，数学家则不断在挑战人类智力的极限。同时，数学难题也一直是大模型难以“征服”的领域之一。数学是推理的语言。长期以来，人们一

2024-06-14 11:54:00

人类如何发现“数”的存在？数学家夏志宏抖音导读数学名著

...对数的认识，伴随了自身文明的发展。12月16日晚8：00，数学家夏志宏教授做客高山科学经典，为网友导读了经典科普名著《数：科学的语言》一书，讲述了这些数的发现过程及其意义。、

2023-12-20 15:23:00

人工智能赢得国际奥数银牌

...沿的数学往往需要极为复杂的证明，比如日本的京都大学数学家望月新一在证明“abc猜想”时，其证明过程长达500页。即便在数学家中，能仔细阅读完该证明过程的就寥寥无几，要是发现其

2024-07-27 16:43:00

南开大学“感念大师”系列奖项重磅颁奖

...光放远，又要脚踏实打好基础，希望未来能有更多的中国数学家走向世界，引领开创数学新领域。龙以明院士向获奖的葛墨林院士和各位老师同学表示祝贺，并表达了对张文中、周海冰等校友捐资助

2023-11-05 21:55:00

陶哲轩全网悬赏「最强大脑」！AI+人类颠覆数学难题？凡尔赛网

...ean）提供了潜在的方法，能够克服这些障碍，并且让专业数学家、广大公众和AI工具的合作成为可能。这种方法的前提是，项目可以以模块化的方式分解成更小的部分，这些部分可以在不必理

2024-09-30 09:54:00

数学的迷人之处在于，它以令人惊奇的方式解释我们的世界

上帝是数学家吗？这个问题令那些最伟大的数学家（哲学家）苦苦思索了几个世纪。正如英国物理学家詹姆斯琼斯曾指出的∶“宇宙似乎是由一位理论数学家设计的。”数学似乎不仅是描述和解释整个宇

2022-12-27 10:49:00

在跨界中提升，在比较中互鉴

...：临沂日报《真与美：丘成桐的数学观》结集了美籍华裔数学家丘成桐近半个世纪以来对数学和人文教育思考的文章、讲话与回忆性散文。丘成桐是陈省身的弟子，菲尔兹奖首位华人得主，美国国家

2024-01-01 09:40:00

关于天才少年离职，任正非正面回应！万字问答全文来了，涉及AI

...、验证、优化来加快科研的迭代速度。当地有很多优秀的数学家、物理学家，你们要充分利用好。 14、刘广垚提问：公司内部有不同的研究部门，比如2012实验室、产品线研究部，包括

2023-03-18 15:17:00

更多关于科技的资讯：

出海再提速！锦江酒店（中国区）宣布旗下7天酒店出海，同日签约

锦江酒店（中国区）规模化出海再次迎来关键节点。10月31日，其于深圳正式宣布，国民品牌7天酒店将进军东南亚市场。这是继今年8月底

2025-11-01 10:02:00

拓宽合作渠道深化技术创新山西电机亮相亚洲国际展会

10月28日，亚洲国际动力传动与控制技术展览会(PTC ASIA 2025)在上海新国际博览中心启幕。近1800家海内外知名展商齐聚

2025-11-01 07:03:00

正式发布！视源股份牵头制定《娱乐用车载显示系统图像质量技术规

2025年10月23日，在全国音频、视频及多媒体系统与设备标准化技术委员会（SAC/TC 242）商用显示标准研究组第六次全会暨标准研讨会上

2025-10-31 08:20:00

中感集团煤仓安全综合解决方案亮相中国国际煤炭采矿展，以系统性

在北京举行的第21届中国国际煤炭采矿技术交流与设备展览会上，中感集团创新展示的“煤仓安全综合解决方案”引发行业高度关注

2025-10-31 08:51:00

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰

2025中国国际数字经济博览会在石家庄国际会展中心开幕。科杰科技董事长于洋受邀出席2025首席数据官峰会论坛,并作主题为《人工智能产业决胜与 Data&

2025-10-31 08:51:00

知与行｜推进县域特色产业数字化转型

■加快构建覆盖全域、经济适用、安全可靠的数字技术支撑体系，着力打通数据壁垒与业务断点，促进产业链各环节融通发展■建立功能完善

2025-10-31 09:05:00

世说新语丨AI时代，图书馆如何更“聪明”

在数字化、网络化、智能化的当下，图书馆的角色和功能正在发生深刻变化。究竟什么样的图书馆更“聪明”？近日，第五届长三角公共图书馆发展论坛在上海举行

2025-10-31 09:05:00

Mutual妙趣艺：全球战略+资源整合，打造文娱IP数字资产

Mutual妙趣艺于2020年成立于美国加州，专注于文娱IP（知识产权）数字资产化领域。公司的核心定位是打造“数字资产领域的AWS”

2025-10-31 10:57:00

临沂联通获全国百城重点区域移动网络质量综合大奖

鲁网10月31日讯近日，“2025年第四届移动网络高质量发展论坛”在北京盛大启幕。在本次论坛上，工业和信息化部委托中国信通院权威发布了2024年“全国百城重点区域移动网络质量专项评测结果”

2025-10-31 11:43:00

当担保遇上AI：一场成长的“双向奔赴”

人工智能（AI）是新一轮科技革命和产业变革的重要驱动力量，广西聚焦国家所需、广西所能、东盟所盼，正加快构建一条“北上广研发+广西集成+东盟应用”的特色发展路径

2025-10-31 11:46:00

aigo国民好物成为第32届WCGC全球总决赛官方唯一翻译类

上海，2025年10月 —— 备受瞩目的第32届世界企业高尔夫挑战赛（WCGC）全球总决赛于2025年10月19日至23日在上海东庄海岸高尔夫俱乐部隆重举行

2025-10-31 11:52:00

让检测全面拥抱AI！科学指南针2025产品服务发布会举行

让检测全面拥抱AI！10月30日，科学指南针2025年度产品服务发布会在杭州举办，来自高校院所、企业、分析测试中心等多方行业代表到场参会

2025-10-31 11:52:00

培育钻定制哪个品牌好？2025最新测评出炉，国产珠宝高性价比

曾几何时，钻石承载着“钻石恒久远，一颗永流传”的爱情神话，而天然钻石的稀缺性更被赋予了极高的市场价值。然而，随着实验室培育钻石技术的突破性进展

2025-10-31 12:14:00

2025年商旅平台选型指南：从合规能力到生态整合的全景评估

在企业商旅管理从“费用管控”向“全流程智能管理”演进的关键时期，平台竞争力已不再局限于单一的预订功能，而是延伸至合规风控

2025-10-31 12:16:00

拓竹荣膺《时代》最佳发明，3D打印技术步入主流创新支撑体系

近期，《时代》周刊公布2025年度最佳发明榜单，揭示一个耐人寻味的现象：在300项突破性发明中，仅有4项被明确标注为3D打印创新

2025-10-31 12:19:00

头条订阅服务

Nature重磅：击败人类数学家，AI首次攻破经典数学难题