• 我的订阅
  • 教育

大语言模型对著名数学问题有“新见解”

类别:教育 发布时间:2023-12-15 01:27:00 来源:每日看点快看

本文转自:科技日报

人工智能提供学习知识新途径

大语言模型对著名数学问题有“新见解”

【总编辑圈点】

科技日报北京12月14日电 (记者张梦然)“深度思维”团队利用大语言模型(LLM)对一个著名的数学问题提出了“新见解”,并通过系统的、迭代的评估框架确保其正确。这一研究或可改进LLM用来解决问题和学习新知识的途径。相关论文发表在14日的《自然》杂志上。

基于人工智能的工具(例如LLM)有时受制于“幻觉”,导致作出看似合理但实际是错误的陈述。加入一个评估步骤,系统地衡量潜在解决方案的准确性,使得利用LLM应对复杂问题成为可能。这些问题一般需要可验证且定义明确,从而使这一工具在数学科学中有潜在价值。

研究团队此次介绍了一种方法,称为“FunSearch”。他们将一组产生创造性解决方案的LLM和一个作为检查者以避免错误建议的评估程序结合起来。接着,将一个多次迭代此过程的演化方法,作为输入来引导LLM。结果表明,这种方法可以得到新的、可验证的正确结果。他们将“FunSearch”应用到了著名的上限集问题(数学中涉及计数和排列领域的一个中心问题),发现了超越最著名上限集的大上限集新构造。

研究人员表示,“FunSearch”的成功关键是它会寻找那些描述怎样解决问题的程序,而非直接寻找解决办法。因为“FunSearch”的结果易于被解释和验证,这意味着这一方法有望激发科学家在该领域的进一步思考。

数学真要成为首个借助AI实现突破的学科吗?一方面,数学家越来越频繁地使用AI;另一方面,AI也很“配合”——既可用于解决编程等应用学科的问题,也可用来攻克包括数学在内的自然学科。本文中这项成果,现阶段可能还不适合解决大多数类型的挑战,但研究团队提出了未来改进的可能。或许在不久之后,“FunSearch”将可用于破解数学界更大范围、更多种多样的难题。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-12-15 06:45:58

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...研究所的何杨辉教授和他的同事们想试试AI能否提出新的见解。于是,他们让AI神经网络在一个包含数百万条椭圆曲线的数据库中搜索曲线的某个特征,结果AI没有让人失望。在对其预测进行
2024-06-14 11:54:00
Nature重磅:击败人类数学家,AI首次攻破经典数学难题
...表示,“希望这能够激发使用 FunSearch 的科学家的进一步见解,推动改进和发现的良性循环。”威斯康星大学麦迪逊分校的合作者和数学教授 Jordan Ellenberg 表示
2023-12-15 14:38:00
人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代
大型语言模型(LLMs)是指采用机器学习技术,利用大量文本数据进行训练,以能够自然地理解和生成自然语言文本的人工智能模型。这些模型可以用于自然语言处理任务,如文本分类、文本生成、
2023-02-24 18:22:00
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
...规模研究,为 LLM 在数学推理任务中的行为提供了重要的见解。 2、作者质疑了当前在 GSM8K 上报告的结果的可靠性
2024-10-14 09:55:00
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大?就此问题,第一财经记者测试了12个大模型,其中阿里通义千问
2024-07-17 11:56:00
...太好的文科生业内人士如何看待这个多模态预训练大语言模型?记者采访了上海交通大学教授、自然语言处理专家赵海。“读图编程”表演令人惊艳赵海教授解释,模态对应的是人类感知类型,包括
2023-03-16 09:23:00
学而思正自研数学大模型MathGPT,由CTO田密负责
...5日消息,搜狐科技了解到,学而思正在进行自研数学大模型的研发,命名为MathGPT,面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心,目前已经取得阶段性成果,并
2023-05-07 03:00:00
...茂松表示,三五年内有望破解智能涌现之谜理解并超越大模型需要数学“应战” ■本报记者 许琦敏瓦特改良蒸汽机后大约100年,热力学三定律才阐明其机理。眼下,Chat
2023-07-26 06:00:00
过好“四关”数学轻松突破
...、基本概念、基本定理;“二批”就是把预习时的体会、见解以及自己暂时不能理解的内容,批注在书的空白地方;“三试”就是尝试性地做一些简单的练习,检验自己预习的效果;“四分”就是把
2023-04-21 04:47:00
更多关于教育的资讯: