• 我的订阅
  • 科技

56年无人解开的数学难题 被谷歌的新AI突破了

类别:科技 发布时间:2025-05-15 23:16:00 来源:浅语科技

去年,AI 能解出博士级别的数学题,已是轰动一时的大新闻;

而今年,能攻克「未解之谜」级别的数学难题的 AI 已经来了。

5 月 15 日,Google DeepMind 发布了全新编程智能体 AlphaEvolve。不同于传统的编程 Agent,它专注于通用算法的自动发现与持续优化。

顾名思义,AlphaEvolve 擅长在「进化」中寻找更优解,它模拟自然选择机制,能在代码中不断迭代、演化出创新算法。

只要问题能用程序表达、结果能用函数评估,AlphaEvolve 就能迭代算法。Google 表示,在组合数学、几何学、数论等超过 50 个未解问题中应用后,AlphaEvolve 在约 20% 的问题上超越了人类现有解法。

DeepMind 研究员 Matej Balog 表示:「AlphaEvolve 在十多个公开的数学问题上取得了突破。

但最让我激动的是:它找到了 56 年以来,4x4 复数矩阵乘法算法的首次改进。这个结果,来自它自创的一种复杂搜索算法。」

AlphaEvolve 的价值不仅在数学,它展现出的是一种通用的「算法发现能力」。Balog 表示:「我们对 AlphaEvolve 的应用,还只是触及表层。」

01 问题能用程序表达、结果能用函数评估,AlphaEvolve 就能迭代算法

Google DeepMind 表示,AlphaEvolve 能够在多个复杂问题中取得突破,关键在于其背后运作的是一整套自动进化机制,能持续优化算法并提升性能。

从本质上看,AlphaEvolve 解决的是一个通用的黑盒优化问题:maximize h(f)。其中,f 是由大型语言模型生成的程序,h 是衡量该程序质量的评估函数。

在实际流程中,AlphaEvolve 首先通过提示采样器(prompt sampler)组装提示词,引导语言模型生成代码。

DeepMind 使用了两个不同的 Gemini 模型协同工作:Gemini Flash 以更高速度生成大量候选方案,扩展思路的广度;Gemini Pro 则提供更深入的结构性建议。

二者结合,使模型能产出具备实际可行性和算法深度的程序。生成的程序会被送入自动评估系统,经过验证、运行和打分后,写入程序数据库。

数据库中运行着一套进化算法,会从已有程序中挑选表现最好的方案,为下一轮提示提供方向,不断迭代出更优解。

AlphaEvovle 的一个核心点就是这套自动评估指标。它能对生成程序进行验证、运行和评分。

每一个程序都会被 h 函数衡量其准确性、运行效率、代码质量等维度。这些评分标准是客观、量化的,使 AlphaEvolve 能够在无需人类直接干预的前提下持续优化。

56年无人解开的数学难题 被谷歌的新AI突破了

图片来源:Google

不过,这里的 h 函数依然由人类研究人员定义,可以是准确率、运行时间,甚至代码可读性等维度的组合。

AlphaEvolve 负责的只是在给定 h 的前提下去寻找最优的 f。对于一些数学问题或研究任务,Google 也可能预设 h。这也说明了 AlphaEvolve 当前的边界:它适用于那些「成果是否优秀」可以自动量化判断的问题。

但如何定义「优秀」,仍需人来给出。在需要人类实验才能确定是否优秀的问题上,AlphaEvolve 就无法评估了。

以 DeepMind 研究员提到的 4 x 4 复数矩阵乘法为例,研究人员设置了一组任务目标,包括达到的最低乘法次数(即张量分解的秩)以及达到该结果的随机种子比例。

这些信号构成了 AlphaEvolve 的优化目标,引导它在复杂的搜索空间中稳步「爬山」。AlphaEvolve 从问题定义出发,基于标准的梯度优化流程(包括初始化器、重建损失函数、Adam 优化器等),演化出了一系列高质量的张量分解算法。

最终,它在 14 个矩阵乘法结构上超越了已知最优结果。其中最引人注目的,是它提出了历史上第一个能用 48 次乘法完成 4×4 复数矩阵乘法的算法——打破了 56 年未被突破的记录。

56年无人解开的数学难题 被谷歌的新AI突破了

图片来源:Google

AlphaEvolve 的技术路线可追溯到 DeepMind 早期提出的 FunSearch 系统。

FunSearch 同样利用语言模型引导程序进化,曾被用于发现数学结构或在线算法策略。但与之相比,AlphaEvolve 的扩展性显著提升:它可以修改完整程序,处理多个函数、组件、甚至跨语言结构协同优化,而不仅限于 Python 中的单一函数。

这种更高的通用性,使 AlphaEvolve 不再只是一个「智能改函数」的工具,而像是一个可以自主演化大型算法系统的「程序设计伙伴」。

据 DeepMind 披露,AlphaEvolve 已被应用于 50 多个数学难题,涵盖数学分析、几何学、组合数学与数论等领域。大多数实验都能在数小时内完成部署。在约 75% 的问题中,它成功重新发现了当前的最优解。

更令人惊喜的是,在约 20% 的问题中,它给出了比已知方法更好的解法。比如在数学界研究了 300 多年的「接吻数问题」中,AlphaEvolve 构造出由 593 个球体组成的新结构,在 11 维空间中刷新了下界。

除了数学,AlphaEvolve 也已在 Google 内部实际落地应用,解决了计算栈中多个层面的工程问题,包括:为 Borg 系统设计新的调度启发式;优化大语言模型训练时使用的矩阵乘法内核;改写 TPU 芯片中的算术电路;加速 Transformer 注意力机制的执行速度。

这些任务之间跨度极大,但都具备一个共性:问题能用程序表达、结果能用函数评估。只要这两点成立,AlphaEvolve 就可以发挥作用。

02 更多的智能供给,带来无限的游戏

此次发布来自 Google DeepMind,这一团队曾推出 AlphaGo、AlphaFold 等具有里程碑意义的 AI 系统,在博弈智能与科学发现领域显著扩展了人工智能的能力边界。

AlphaEvolve,与依赖强化学习和自我博弈(如 AlphaGo)的系统不同,是通过语言模型生成大量程序候选,结合自动评估与进化机制,筛选出更优的算法方案。

它更像是一种可编排、可扩展的算法构造与发现框架。相比 AlphaGo 展示的是人工智能如何在规则明确定义的博弈中超越人类,AlphaEvolve 的意义可能更在于:它为研究者提供了一种持续、可扩展的算法生成与优化能力。

算法设计与调优历来是一种高度稀缺的技术能力。算法工程师在就业市场上普遍享有更高的薪酬与职位门槛,足以反映其复杂性与稀缺性。

而现在,只要设定明确的评估方式,AlphaEvolve 就有可能以接近无限的算力和耐心,自动探索并优化算法解法。这意味着,「发现并改进算法」这项曾依赖个体经验的能力,开始从稀缺、手工、不可复制,变为可自动化、可规模化的智能供给。

尤瓦尔·赫拉利曾经有一个比喻,形容 AlphaGo 为人类带来的冲击。人类一直在围棋星球上探索如何下围棋,不断有人画出路线图,探索围棋星球的样貌。

直到 AI 出现,人类才惊觉,自己不过是在围棋星球的一座小岛上原地打转,而真正的星球辽阔无边,未曾涉足的区域远超想象。

而去年到今年,在科研领域,我们也不断地看到 AI 正在做同样的事情。2024 年,AI 相关成果首次同时获得诺贝尔物理学奖与化学奖,而这很有可能成为未来的科研常态。

从某种程度上说,AlphaEvolve 所做的,是以前所未有的速度加快这张科研的「未知地图」的展开。

以无限的智能供给,让每个领域都有可能被再探索一遍。当「能被发现的算法」不再稀缺,人类对知识的征途,或许才刚刚开始。

56年无人解开的数学难题 被谷歌的新AI突破了

责任编辑:若风

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-05-16 05:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

用好数学工具  解决力学难题(讲述·一辈子一件事)
...、大连理工大学教授钟万勰——用好数学工具 解决力学难题(讲述·一辈子一件事)钟万勰(右一)在跟学生讨论。大连理工大学供图中年时的钟万勰。大连理工大学供图人物小传钟万勰,193
2023-05-05 05:57:00
Nature重磅:击败人类数学家,AI首次攻破经典数学难题
人工智能(AI)大模型,击败了人类数学家。今天,在 Nature 上发表的一篇论文中,Google DeepMind 的研究团队介绍了一种搜索数学和计算机科学新解决方案的方法——FunSearch
2023-12-15 14:38:00
华裔学者出手!50年零进展算法难题被突破
半个世纪没有进展的问题,如今终于有了新突破!而且是一位华人科学家,单枪匹马搞定。来自芝加哥伊利诺伊大学厄巴纳-香槟分校的XiaoruiSun,提出了一种新方法,能够更快速确定群同
2023-07-05 13:57:00
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...智慧极限的突破。迄今为止,解决或协助解决高等级数学难题,仍是AI领域一项极其复杂的多维度重大挑战。随着AI越来越多出现在数学领域,这是否预示着AI开始具有人类水平的推理能力?
2024-06-14 11:54:00
真相揭秘!德国数学家证明4维空间存在后发生了什么?
...供了充足的新思路和解决方案,以应对现实世界中的一些难题。例如,在交通规划和物流领域,我们可以借助四维时空模型更准确地预测和优化交通流量和物资分配。当然,在深入研究和应用这个新
2023-11-30 16:20:00
Anthropic挖走DeepMind强化学习大牛、AlphaGo核心作者
...haProof 和 AlphaGeometry 2 在 IMO 竞赛上共同实现了里程碑式的突破。AlphaProof 是一种用于形式化数学推理的强化学习系统
2024-10-30 09:54:00
本文转自:大众日报□本报记者王 原本报通讯员车慧卿王一晗“我从小时候起就热爱数学。”李国君教授告诉记者,他是恢复高考后的第一届大学生,十分珍惜进入大学学习的机会,用“饥饿的人扑到
2023-04-21 09:57:00
本科经典算法Dijkstra,被证明普遍最优了:最坏情况性能也最优!
...来解决最短路径问题的经典算法——Dijkstra,现在有了新突破:被证明具有普遍最优性(Universal Optimality)
2024-10-28 09:51:00
计算机科学的高塔
...,他也一直在不停地变换研究的问题和方向,去解决各种难题。 零知识证明维格德森早期的一项很重要的工作就是对零知识证明的贡献。零知识证明这一概念最早由莎菲·戈德瓦塞尔、希尔维奥
2024-05-23 13:37:00
更多关于科技的资讯:
近年来,我国商业保险发展速度较快,产品的种类也日渐丰富,除了大家比较熟悉的车损险、医疗险、航空险等,依托宠物经济应运而生的宠物保险也受到越来越多的关注
2025-11-14 12:19:00
携程商旅设立千万级保障金,推动行业迈向\
11月9日,2025年携程集团全球合作伙伴峰会商旅分论坛暨携程商旅伙伴大会在土耳其伊斯坦布尔举办。会上,携程商旅顺应行业"高品质服务"及"全球化发展"两大趋势
2025-11-14 12:59:00
大华股份亮相全球智慧城市大会
近日,2025全球智慧城市大会在西班牙巴塞罗那会展中心盛大启幕。大华股份携全栈式智慧城市解决方案重磅亮相,围绕城市安全
2025-11-14 12:59:00
虹软科技AI视觉赋能BOLON AI Glasses重磅发布,与Rokid乐奇深度合作打造创新体验
BOLON AI Glasses正式发布,这是国内领先的 AR 眼镜制造商 Rokid 乐奇与 BOLON 眼镜联合打造的全新一代 AI 眼镜
2025-11-14 12:59:00
2025青岛虚拟现实创新大会将启,星鲨研究院探索“具身智能”前沿
鲁网11月14日讯“在这里,唯一限制你的是你自己的想象力。”科幻电影《头号玩家》中对于“绿洲”的这一描述,恰如其分地展现了虚拟现实产业的无限可能
2025-11-14 10:18:00
中新经纬11月14日电 据“网信中国”微信公众号14日消息,网信部门从严整治利用AI仿冒公众人物开展直播营销问题乱象。近期
2025-11-14 10:30:00
大麦娱乐推出全新品牌“大麦国际” 提供全球演出购票、观演服务
购买海外演出门票,现在有了新选择。11月14日,大麦娱乐宣布推出旗下全新业务品牌、全球演出服务平台“大麦国际(MAISEAT)”
2025-11-14 10:45:00
大河网讯 11月11日,全省数字影像检查“云胶片”联盟采购工作顺利开标,产生了拟中选结果,中原算力科技发展有限公司等6家企业拟中选
2025-11-14 10:53:00
鲁网11月13日讯11月13日,山东瑞程数据科技有限公司与济宁学院联合攻关的“多模态肉品AI快检系统”核心技术,在第十四届中国创新创业大赛颠覆性技术创新大赛中斩获优秀奖
2025-11-14 10:54:00
记者走基层|“黑科技”上线,让温暖精准入户
11月12日,河北邢襄热力集团邢台供热分公司二工区三班班长丁帅,在三义庙换热站查看设备运行情况。 河北日报记者 宋 平摄随着11月15日临近
2025-11-14 08:02:00
11月13日,太原公共交通控股(集团)有限公司(以下简称“太原公交”)与中车时代电动汽车股份有限公司(以下简称“中车电动”)举行框架合作协议签约仪式
2025-11-14 07:50:00
记者走基层|智能安全帽,让矿工有了AI“卫士”
11月5日,中煤张家口煤矿机械有限责任公司所属恒洋电器有限公司工作人员介绍智能安全帽产品。河北日报记者 魏 雨摄“嘀嘀
2025-11-13 08:03:00
“长与短”周期变革,“快与慢”时效重构,“热与冷”业态碰撞—— “双11”三重奏,解读消费新变局□南京日报/紫金山新闻记者黄琳燕11月12日中午
2025-11-13 08:05:00
南报网讯(记者周容璇)日前,在南京医药中央物流中心,一辆白色无人车平稳地穿梭于主仓库与宝湾库区之间,仅用15分钟便完成了一次驳货作业
2025-11-13 08:05:00
向“质”攀升,南京机器人解锁“智造”新图景
全链条持续发力,以硬核技术竞逐市场向“质”攀升,南京机器人解锁“智造”新图景□南京日报/紫金山新闻记者徐宁 实习生黄倩机器人是智能制造的核心组成部分
2025-11-13 08:05:00