• 我的订阅
  • 科技

陶哲轩全网悬赏「最强大脑」!AI+人类颠覆数学难题?凡尔赛网友已下场

类别:科技 发布时间:2024-09-30 09:54:00 来源:新智元

陶哲轩全网悬赏「最强大脑」!AI+人类颠覆数学难题?凡尔赛网友已下场

【新智元导读】最近,陶哲轩向广大网友和数学爱好者发起了挑战:大众数学爱好者、证明助理、自动化助手和AI联合起来,是否可以证明扩展几个数量级的数学问题?

想参加陶哲轩发起的「众包」数学研究项目吗?

机会来了!

陶哲轩全网悬赏「最强大脑」!AI+人类颠覆数学难题?凡尔赛网友已下场

AI辅助证明数学研究,越来越可行了

他们每个人都对项目的各方面都足够熟悉,可以验证彼此的贡献。

但如果要组织起更大规模的数学研究项目,特别是涉及公众贡献的项目,就麻烦多了。

原因在于,很难验证所有人的贡献。

2023年底,陶哲轩宣布:将多项式Freiman-Ruzsa猜想的证明形式化的Lean4项目,在三周后取得了成功(图为最新状态)

要知道,在数学论证某个部分中的单个错误,可能就会使整个项目失败。

而且,以一个典型数学项目的复杂程度来说,期待具有本科数学教育水平的公众做出有意义的贡献,也是不现实的。

由此我们也可以知道,把AI工具纳入到数学研究项目中,也是极有挑战性的。

因为AI会生成看似合理但实际上毫无意义的论证,因此需要额外验证,才能将AI生成的部分添加到项目中。

好在,证明辅助语言(比如Lean)提供了潜在的方法,能够克服这些障碍,并且让专业数学家、广大公众和AI工具的合作成为可能。

这种方法的前提是,项目可以以模块化的方式分解成更小的部分,这些部分可以在不必理解整个项目的情况下就能完成。

目前的例子主要有将现有数学结果形式化的项目(比如对Marton最近证明的PFR猜想的形式化)。

这些形式化工作,主要是通过众包方式由人类贡献者(包括专业数学家和感兴趣的公众)完成的。

同时,还有一些新兴的尝试,试图引入更多的自动化工具来完成,后者包括传统的自动定理证明器,以及更现代的基于AI的工具。

探索全新数学问题,成为可能

并且,陶哲轩还认为,这种全新范式不仅可以用于形式化现有的数学,还可以用来探索全新的数学!

过去,他曾经和继任组织过一个在线协作「Polymath」的项目,就是一个很好的例子。

不过,这个项目没有将证明辅助语言纳入工作流,贡献就必须由人类主持人管理和验证,这项工作非常耗时,也限制了将这些项目进一步扩大。

现在,陶哲轩希望,添加证明辅助语言能突破这个瓶颈。

而他尤其感兴趣的,就是是否可能使用这些现代工具同时探索一类数学问题,而不是一次只关注一两个问题。

本质上,这种方法是可模块化的重复任务,如果有适当的平台来严格协调所有贡献,众包和自动化工具可能会尤其有用。

如果用以前的方法,这种数学问题类型是无法扩大规模的。除非在多年时间里,随着个别论文慢慢地一次探索一个数据点,直到对这类问题获得合理的直觉。

此外,如果有一个大型问题数据集,可能有助于对各种自动化工具进行性能评估,并且比较不同工作流程的效率。

在今年7月,第五个忙碌海狸数被证实为是47,176,870。

陶哲轩全网悬赏「最强大脑」!AI+人类颠覆数学难题?凡尔赛网友已下场

一些更早的众包计算项目,比如「互联网梅森素数大搜索」(Great Internet Mersenne Prime Search, GIMPS),在内在精神上跟这些项目也有些类似,尽管它们使用的是更传统的工作量证明机制,而不是证明辅助语言。

陶哲轩全网悬赏「最强大脑」!AI+人类颠覆数学难题?凡尔赛网友已下场

陶哲轩表示,很想知道是否还有其他现存的众包项目探索数学空间的例子,以及是否有可用的经验教训。

陶哲轩提出新项目

为此,陶哲轩自己也提出了一个项目,来进一步测试这一范式。

这个项目受到去年MathOverflow问题的启发。

陶哲轩全网悬赏「最强大脑」!AI+人类颠覆数学难题?凡尔赛网友已下场

不久后,陶哲轩在自己的Mathstodon上,对它进行了进一步讨论。

陶哲轩全网悬赏「最强大脑」!AI+人类颠覆数学难题?凡尔赛网友已下场

这个问题属于泛代数(universal algebra)领域,涉及对原群(magma)的简单等式理论的中等规模探索。

原群是一个配备了二元运算 的集合G。

最初,这个运算o没有附加任何额外的公理,因此原群本身是较为简单的结构。

当然,通过添加额外的公理,如恒等公理或结合律公理,我们可以得到更熟悉的数学对象,例如群、半群或幺半群。

在这里,我们感兴趣的是(无常数的)等式公理。这些公理涉及由运算o和G中的一个或多个未知变量构建的表达式的相等性。

此类公理的两个熟悉的例子,是交换律x o y = y o x和结合律(x o y) o z = x o (y o z)。

其中x,y,z是原群G中的未知变量。

另一方面,(左)恒等公理e o x = x在这里不被视为等式公理(equational axiom),因为它涉及一个常数e ∈ G。这类涉及常数的公理在本研究中不予讨论。

接下来,为了阐明自己发起的研究项目,陶哲轩介绍了十一个关于原群的等式公理例子。

这些等式公理是仅涉及原群运算和未知变量的等式——

因此,举例来说,等式7表示交换律公理,而等式10表示结合律公理。

常数公理等式1是最强的,因为它限制了原群G最多只能有一个元素;与之相反,自反公理等式11是最弱的,所有原群都满足这一公理。

接下来,我们就可以探讨这些公理之间的推导关系:哪些公理能推出哪些公理?

例如,等式1可以推导出这个列表中的所有其他公理,而这些公理又可以推导出等式11。

等式8作为特殊情况可以推导出等式9,而等式9又作为特殊情况可以推导出等式10。

这些公理之间完整的推导关系可以用以下哈斯图(Hasse diagram)来描述:

这一结果特别回答了数学问答网站MathOverflow上的一个问题:是否存在介于常数公理(等式1)和结合律公理(等式10)之间的等式公理(equational axioms)。

值得注意的是,这里大多数的蕴含关系都很容易证明。然而,其中存在一个非平凡的蕴含关系。

这个关系是在一个与前述问题密切相关的MathOverflow帖子回答中得到的:

命题1:等式4蕴含等式7

证明:假设G满足等式4,因此

陶哲轩全网悬赏「最强大脑」!AI+人类颠覆数学难题?凡尔赛网友已下场

对所有x,y ∈ G成立。

特别是,当y = x o x时,可以得出(x o x) o (x o x) = (x o x) o x。

再次应用(1),可以得出x o x是幂等的:

现在,在(1)中将x替换为x o x,然后使用(2),可以得出(x o x) o y = y o (x o x)。

尤其,x o x与y o y是可交换的:

此外,通过两次应用(1),可以得到(x o x) o (y o y) = (y o y) o x = x o y。

因此,(3)就可以简化为x o y = y o x,这就是等式7。

上述论证过程的形式化,可以在Lean中找到。

然而值得注意的是,确定一组等式公理是否决定另一组等式公理的一般问题,是不可判定的。

因此,这里的情况有点类似于「忙碌海狸」挑战,即在某个复杂点之后,我们必然会遇到不可判定的问题;但在达到这个阈值之前,我们仍有希望发现有趣的问题和现象。

上面的哈斯图不仅断言了列出的等式公理之间的蕴含关系,还断言了公理之间的非蕴含关系。

例如,如图所示,交换公理等式7并不蕴含等式4公理(x + x) + y = y + x。

要证明这一点,只需找出一个满足交换公理等式7但不满足等式4公理的原群的例子。

比如,在这种情况下,我们可以选择自然数集N,其运算为x o y := x+y。

更一般地,该图断言以下非蕴含关系,这些关系(连同已指出的蕴含关系)完整描述了这十一个公理之间蕴含关系的偏序集:

在此,陶哲轩邀请读者提出反例,来完成其中的部分证明。

最难找到的反例,就是等式9无法推出等式8了。

用Lean可以给出解决方案。

另外,陶哲轩还提供了一个GitHub存储库,包含了所有上述包含和反包含关系的Lean证明。

可以看出,仅仅计算11个等式的哈斯图就已经有些繁琐了。

而陶哲轩提出的项目,是尝试将这个哈斯图扩展几个数量级,覆盖更大范围的等式集。

他提议的集合是ε,即最多使用原群运算o四次的等式集,直到重新标记和等式的自反性和对称性公理。

这包括了上述十一个等式,但还有更多。

还有多少呢?

回想一下,卡特兰数C_n是用二元运算o(应用于n+1个占位符变量)形成表达式的方法数;而给定m个占位符变量的字符串,贝尔数B_m是为这些变量分配名称的方法数(可以重新标记),其中允许某些占位符被分配相同的名称。

因此,忽略对称性,最多涉及四次运算的等式数量是

左侧和右侧相同的等式数量是

这些都等同于自反公理(等式11)。

剩下的9118个等式由于等式的对称性成对出现,所以ε的总大小是

陶哲轩表示,自己还没有生成这样恒等式的完整列表,但他猜想,使用Python就可以轻松完成。

使用AI工具,应该能生成大部分所需的代码。

他表示,自己完全不清楚ε的几何结构会是什么样子。

大多数等式会彼此不可比较吗?它会分为「强」公理和「弱」公理吗?

现在,陶哲轩的留言区,已经有了几十条评论。

感兴趣的读者,陶哲轩也向你发出了邀请。

参考资料:

https://terrytao.wordpress.com/2024/09/25/a-pilot-project-in-universal-algebra-to-explore-new-ways-to-collaborate-and-use-machine-assistance/

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-30 11:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

凡尔赛c5x,b级车巅峰者
被誉为燃油时代法系车最后荣光的凡尔赛C5X月销量虽然很难上万,但四五千台还是有的,这款B级车虽因板车悬架、发动机抖动等小故障难以在销量上进一步突破,但我认为这款法系车的整体机械素
2023-01-17 15:51:00
街机游戏《侍魂》让人无法想象的角色原型,彻底颠覆认知
...,我们通过多种方式对比才发现。小时候看过一部名为《凡尔赛的玫瑰》的动画片,那个年代的小伙伴就算没有看过也听过吧!八九十年代的少女漫画非常流行,催生了不少少女风格的作品。虽然说
2022-12-23 09:28:00
水哥王昱珩说:赚钱这件事是最简单的,大家都被他的凡尔赛惊到了
...接惊呆大家,他说赚钱这件事是最简单的,大家都被他的凡尔赛惊到了。杨天真、杨笠、傅首尔,三个人加一起都接不住的恐怕就只有水哥了。好吧,赚钱容易王昱珩,财务自由王昱珩!不过想想也
2023-02-26 21:44:00
开启“先试后买”消费新模式,凡尔赛C5 X底气何在?
...为客户出行全力护航的东风雪铁龙就从中脱颖而出,最近凡尔赛C5X又推出了“先试后买”政策,包含首付9999元、月供999元等购车优惠福利,加上48+小时免费试用活动、“3年保值
2023-07-09 22:58:00
打开生产线全网直播 这家汽车工厂制造品质到底有多牛?
...直播全天候覆盖,生产线沉浸式直播,新华网现场直播,凡尔赛C5X车辆出口现场直播……,11月1日-12日,神龙汽车“工厂直销会嗨购双十一”活动重磅来袭。活动期间神龙汽车全系车型
2023-11-07 22:09:00
凡尔赛c5x2023款安全性如何?来了解下吧
...高价值”呢?其实市场上已经有了范本,前段时间上市的凡尔赛C5X(参数丨图片)2023款就是其中之一。笔者通过与同级别车型的对比
2023-06-17 06:54:00
解构四位伟人的大脑,你和天才的大脑有多少差别?
...我们小时候纠结上清华还是上北大的梦想还要不真实,比凡尔赛还凡尔赛。可是这就是北大天才学神韦东奕的真实写照。我们总是向往天才,那么究竟天才的大脑和我们一般人的大脑有什么最本质的
2023-01-20 06:00:00
东风雪铁龙李旸:围绕客户,要打长期“价值战”
...值的价格体系。而在本届上海车展上,东风雪铁龙带来的凡尔赛C5X2023款、C6纪念版则是东风雪铁龙产品价值最直观的体现
2023-04-25 00:58:00
高燃!这不是电影,这是中国军人的日常!
特种兵出差为啥要带荧光棒?歼-16的“基本操作”有多凡尔赛?火遍全网的航母人喊话有多霸气?01特种兵背包有多沉?撒贝宁差点摔个跟头!说到今年火出圈的“特种兵式旅行”,你一定不陌生
2023-08-01 11:30:00
更多关于科技的资讯:
Airbnb店铺该如何推广
Airbnb是一个全球性的在线短租平台,世界各地的房东都可以在这将空闲房产出租给来自全球的旅行者。今天带大家了解一些策略和方法
2025-04-03 11:18:00
‌家家悦和瑞广场店焕新升级盛大开业 与您共赴美好生活
4月3日,家家悦和瑞广场店改造全新面貌盛大开业。家家悦和瑞广场店是继环宇城升级改造的第二家门店。作为一家社区综超门店,和瑞广场店经营面积1000余平
2025-04-03 11:20:00
当减肥遇上黑科技 年轻人找到了“快乐减肥”的秘诀
在快节奏的现代生活中,体重管理已不再是个人选择,而是关乎全民健康素养的公共议题。而传统减肥方式始终无法突破人性的桎梏。健身房里的跑步机沦为晾衣架
2025-04-03 11:21:00
“与中国同行就是与机遇同行,相信中国就是相信明天,投资中国就是投资未来”。3月28日,国家主席习近平在北京人民大会堂会见国际工商界代表时
2025-04-03 11:21:00
近年来,随着经济复苏进程加快,市场需求也愈加多元,金融机构紧跟政策引导,不断通过创新活动与产品,扩内需,助惠民,推动消费提质扩容
2025-04-03 11:23:00
君乐宝:深耕益生菌研发,领航乳品创新之路
在竞争激烈的乳品市场中,君乐宝乳业集团凭借其深厚的益生菌研发实力,不仅赢得消费者的广泛认可,更在行业内树立起科研创新的标杆
2025-04-03 11:26:00
这种看似自由的生活态度:正在杀死你的“活人感”
周末醒来的早晨,手机弹出了健身教练的课程邀请。犹豫一下,想起要找装备换衣服就觉得好麻烦,于是顺手划掉通知,想着“算了算了
2025-04-03 11:41:00
腾讯稳居全球移动发行商收入榜第一!字节跳动排第二
快科技4月3日消息,近日,Sensor Tower发布了《2024年全球移动发行商收入TOP50》榜单。据了解,在2024年
2025-04-03 11:41:00
吞吐量30倍提升!NVIDIA秀Blackwell性能:打破MLPerf记录居第一
快科技4月3日消息,NVIDIA在官网表示,在最新的MLPerf V5.0基准测试中,NVIDIA的Blackwell平台取得了令人瞩目的成绩
2025-04-03 11:41:00
20多万的长城灵魂摩托供不应求 二手平台有人加价5千元转订
快科技4月3日消息,因为长城灵魂摩托采用限量发售的形式,基本上每次新一批车源都很快被抢购一空,这也导致不少车主无法成功抢到车
2025-04-03 11:41:00
山西怀仁3.6级地震:震源深度15千米
快科技4月3日消息,中国地震台网正式测定:04月03日09时53分在山西朔州市怀仁市(北纬39.81度,东经113.16度)发生3
2025-04-03 11:41:00
全球唯一!劳斯莱斯幻影定制版亮相:25万针绣出\
快科技4月3日消息,劳斯莱斯发布了幻影“春日花见”定制版车型官图。这款车型由一位日本客户委托定制,灵感源自日本传统“花见”习俗
2025-04-03 11:41:00
6999元起 华为智慧屏S6 Pro开售:支持灵犀指向遥控
快科技4月3日消息,华为智慧屏S6 Pro正式开售,号称为全家人的“巨幕手机”,售价6999元起。据悉,华为智慧屏S6 Pro配备了灵犀指向遥控器
2025-04-03 11:41:00
正益信息:用专业赋能,领航行业数字化变革
在数字化建设的浪潮中,众多行业对网络基础设施的需求愈发迫切。广州市正益信息技术有限公司凭借过硬的技术实力与丰富的行业经验
2025-04-03 11:46:00
廊坊:以旧换新加力扩围 “催旺”家电数码消费市场
河北新闻网讯(记者刘杰)“家电以旧换新,政府补贴20%,单件最高补贴2000元……”3月30日,在廊坊市区明珠集团电器卖场举办的2025春季品质家电焕新家装节现场
2025-04-03 11:54:00