• 我的订阅
  • 科技

人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代

类别:科技 发布时间:2023-02-24 18:22:00 来源:浅语科技

人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代

大型语言模型(LLMs)是指采用机器学习技术,利用大量文本数据进行训练,以能够自然地理解和生成自然语言文本的人工智能模型。这些模型可以用于自然语言处理任务,如文本分类、文本生成、语言翻译、问题回答和摘要生成等。最近几年,由于深度学习技术的进步,大型语言模型已经取得了令人瞩目的成就,例如OpenAI的GPT系列模型和Google的BERT模型等。这些模型似乎具有人类的智力和创造力。他们对书面问题提供详细而清晰的回答。

几十年来,数学家一直试图将证明转化为计算机代码,这一过程被称为形式化。如果你把证明写成代码,计算机运行代码时没有错误,你就知道证明是正确的。但证明一个命题可能需要数百或数千个小时。

在过去的五年里,人工智能研究人员已经开始教LLMs自动将数学语句形式化。LLMs已经可以将一种自然语言翻译成另一种自然语言。但从数学到代码的转换是一个艰巨的挑战。

人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代

尽管LLMs在自然语言处理等领域取得了很大的成功,但是它们也存在一些问题:

数据偏差:LLMs的性能取决于其训练数据。如果训练数据存在偏差,模型就会学到这些偏差,从而影响其性能。

偏见:LLMs可能会从其训练数据中学习到偏见,并将这些偏见反映在其生成的文本中。这可能导致出现歧视性语言或错误的陈述。

知识表示:LLMs没有真正的理解语言或世界的知识,它们只是学习出现在数据中的模式。这意味着它们可能会在处理新的情况时出现问题。

模型大小:LLMs需要大量的计算资源和存储空间,以及大量的训练数据。这使得训练和部署成本非常高。

环境依赖性:LLMs的性能取决于输入的上下文和环境。如果输入的数据与训练数据不同,它们可能会产生错误的输出。

基于上述问题,这些模型有时会做出不合逻辑的陈述,或者自信地把谎言说成事实。谷歌AI的吴宇怀表示:“我们不想创建一个像人类一样说话的语言模型,我们想让它明白自己在说什么。”

人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代

吴是最近两篇论文的合著者,这两篇论文提出了一种实现这一目标的方法。它们是关于一个非常具体的应用的:训练人工智能系统做数学。

人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代

第一篇论文描述了如何教LLM将普通的数学语句转换为计算机可以运行和检查的正式代码。第二篇训练LLM不仅要理解自然语言数学问题,而且要使用一个名为Minerva的系统实际解决这些问题。

Minerva指的是一个用于解决数学问题的系统,它是一个组合了自然语言处理和数学推理的系统。这个系统的作用是帮助计算机理解自然语言中的数学问题,从而能够通过推理和计算得出问题的答案。具体来说,这个系统包括多个子系统,包括自然语言处理、问题建模、数学知识库和推理引擎等。通过这些子系统的协作,Minerva能够有效地解决自然语言数学问题。

总之,这些论文提出了未来人工智能设计的蓝图,LLM可以通过数学思维学习推理。

人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代

研究人员主要使用名为Codex的LLM(基于GPT-3)。为了让Codex能够很好地理解数学,从而实现自动形式化,他们只提供了两个自然语言数学问题示例及其正式代码翻译。在简短的训练之后,Codex给出了来自高中比赛的近4000道数学题目的自然语言陈述。起初,Codex准确率略低于30%。当它失败时,它创造了一些术语来填补翻译词典的空白。

在此研究之前,Codex从未尝试在自然语言和形式数学代码之间进行翻译。但Codex通过在GitHub上的培训熟悉代码,也熟悉互联网上的自然语言数学。在此基础上,研究人员只需向它展示几个他们想要的例子,Codex就可以开始连接这些点了。

研究人员不仅试图教LLMs如何翻译数学问题,而且还试图教他们如何解决问题。

Minerva数学

人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代

第二篇论文虽然独立于早期的自动形式化工作,但也有类似的风格。谷歌的研究团队训练了一种LLM来详细回答高中竞赛级别的数学问题,例如“平行于y=4x+6的直线经过(5,10),这条直线与y轴交点的y坐标是多少?”

作者从一个名为PaLM的LLM开始,它已经接受了一般自然语言内容的训练,类似于GPT-3。他们将这个增强模型命名为Minerva。

人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代

研究人员向Minerva展示了他们想要的四个例子。然后他们在一系列定量推理问题上测试了这个模型。Minerva的表现因科目而异:在某些科目如代数上,它的正确率略高于一半,而在其他科目如几何上则略低于一半。

作者们担心的一个问题是Minerva正确回答问题只是因为它已经在训练数据中看到了这些问题或类似的问题。这个问题被称为“污染(pollution)”,它使得人们很难知道一个模型是真正在解决问题,还是只是在复制别人的工作。

为了防止这种可能性,研究人员让Minerva参加了波兰的2022年国家数学考试,它答对了65%的问题。这表明训练有素的模型具有解决数学问题的能力。

尽管Minerva的工作令人印象深刻,但它带有一个严重的问题,作者也指出了这一点:Minerva没有办法自动验证它是否正确地回答了问题。即使它确实正确地回答了一个问题,它也不能检查它所采取的步骤是否有效。

人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代

换句话说,Minerva它不能检查它的工作,这意味着它需要依靠人类的反馈来变得更好。因此,研究人员怀疑这种方法能否扩大到复杂问题上。

吴指出,一方面,如果你研究自然语言或Minerva类型的推理,有很多数据可以利用——整个数学互联网,但本质上你不能用它进行强化学习。另一方面,像Isabelle/HOL这样的证明助手提供了一个基础的环境,但几乎没有数据可供训练。我们需要某种桥梁把它们连接起来。

自动形式化就是那个桥。自动形式化的改进可以帮助数学家在编写证明和验证工作正确性方面实现自动化。

通过结合这两篇论文的进步,像Minerva这样的系统可以首先自动形式化自然语言数学问题,然后解决它们,并使用证明助手检查它们的工作。这种即时检查将为强化学习提供必要的反馈,使这些程序能够从错误中学习。最后,他们会得到一个可证明的正确答案,并附带一系列逻辑步骤——有效地结合了LLM和强化学习的力量。

人工智能研究人员还有更广泛的目标。他们认为数学是开发人工智能推理技能的完美证明,因为它可以说是所有推理任务中最难的。按照这种想法,如果一台机器能够有效地进行数学推理,那么它自然应该获得其他技能,比如编写计算机代码或提供医疗诊断的能力。

人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代

但是仍然有一些工作是目前的人工智能所无法替代的的,例如:

艺术创作:创造真正的、有创意的艺术作品需要人类的创造力和情感体验的。

心理治疗:面对严重的心理问题,人类专业心理医生提供的治疗和支持无法被取代。

体力劳动:虽然有机器人可以执行一些体力劳动工作,但是执行某些复杂的任务仍然需要人类的技能。

社交关系:建立和维护人际关系需要人类的情感和社交技能。

总之,在许多领域中,人类的情感、判断和创造力是无法被替代的。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-02-24 19:45:11

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

《中国人工智能简史》:数学家翻开了中国人工智能研究的第一页
...代点之一。相比1979年所开启的波澜壮阔的新时代,中国人工智能(Artifcial Intelligence,AI)研究在1979年的起步只能算历史大潮中的一朵不起眼的浪花
2023-09-04 16:58:00
人工智能数学基础:解锁智能世界的十大密钥
在人工智能的浩瀚海洋中,数学基础是不可或缺的重要支柱。它不仅是理解算法原理的钥匙,更是实现技术创新的关键。掌握人工智能数学基础,就如同手握一把解锁智能世界的密钥,让我们能够深入探
2024-04-24 12:02:00
西湖大学新增数学与应用数学、人工智能两个本科专业
...20日,记者从西湖大学获悉,该校新增数学与应用数学、人工智能两个本科专业,并列入西湖大学2024年本科招生计划,这意味着今年西湖大学本科生招生专业增至7个。近日,教育部公布了
2024-03-20 20:38:00
2024年世界人工智能大会“数学与人工智能”学术会议在沪举办
本文转自:人民网-上海频道近日,2024年世界人工智能大会期间,由斯梅尔数学与计算研究院主办的“数学与人工智能”学术会议在上海世博中心举办。来自全球多位知名数学家和科学家围绕机器
2024-07-10 22:53:00
...辑思维的提升,数学都发挥着不可替代的作用。尤其是在人工智能深度赋能千行百业,影响力与日俱增的当下,数学这门基础学科的发展和本土创新人才的培养,始终是科学界和教育界关注的焦点。
2025-03-17 13:06:00
本文转自:北京晚报数学卷创设真实情境新质生产力人工智能入题本报讯(记者李祺瑶 牛伟坤)新质生产力、人工智能、生态环境保护……昨天,初中学业水平考试数学科目结束,考生们对试卷中贴近
2024-06-25 13:48:00
作为一名高中生,我深切地感受到人工智能时代的浪潮正深刻地改变着我们的学习方式,尤其是在数学学习上。数学,这门充满逻辑与美感的学科,曾让我既敬畏又着迷。在人工智能的助力下,我找到了
2025-02-15 05:29:00
好未来自研数学大模型MathGPT开启内测 用AI实现因材施教
...新了一个具有代表性和挑战性的数学任务评测集,供全球人工智能专家、数学爱好者体验和测评。田密介绍,希望让MathGPT在数学教育领域发挥更大作用,好未来愿意把基于大规模、高质量
2023-08-24 19:02:00
从个性化到情绪智能,揭秘美国AI教育产品的市场霸主之路
...创新无疑有很多值得学习和借鉴的地方。美国很早就针对人工智能技术可能对教育带来的影响提出了两方面的战略:第一,可以通过将人工智能技术应用于教学环节,为学生提供个性化教学服务,提
2024-06-29 09:29:00
更多关于科技的资讯:
以激光方案替代人工和除草剂,农业机器人企业蔚蓝引擎获司南导航天使投资|硬氪首发
作者丨欧雪编辑丨袁斯来硬氪获悉,精准农业机器人企业蔚蓝引擎(上海)科技有限公司(下称「蔚蓝引擎」)宣布完成天使轮融资,本轮投资方为司南导航
2025-09-03 10:27:00
T3出行携手江苏省测绘工程院打造智能汽车数据流通平台 时空数据“动起来” 自动驾驶“跑起来”南报网讯(通讯员王亭亭记者徐宁)9月2日
2025-09-03 08:11:00
南报网讯(通讯员丁雨宋启欣陶炎记者徐宁)为有效攻克石油化工领域电气仪表专业生产运行中的难题,近日,扬子石化电仪中心成立AI专项小组
2025-09-03 08:11:00
线下体验线上下单,“宁工品推”再加码政企合力打造惠民盛宴,点燃消费新引擎南报网讯(记者徐宁)8月29日—8月31日,“宁工品推”消费品惠民系列活动在江宁区举办
2025-09-03 08:12:00
羽乐科技晋级“数据要素×”大赛决赛,以数据智能赋能行业创新!
近日,2025年“数据要素×”大赛各分赛区决赛入围名单正式公布。本届大赛由国家数据局、中央网信办、工业和信息化部、人力资源社会保障部等20个部委联合主办
2025-09-03 11:10:00
近日,英伟达正式宣布其新一代机器人计算平台JetsonThor开发套件及量产模组全面上市,这款被称为“机器人大脑”的革命性产品
2025-09-03 09:46:00
厦门网讯(厦门日报记者 吴君宁)金融的活力与效能直接影响跨境投资的质量和规模,为此,第二十五届投洽会进一步加大了国内外金融机构的参与力度
2025-09-03 08:23:00
集萃智造研发智能养老机器人入选“国家级试点”递送物品助喂药 轻扶起身防跌倒南报网讯(通讯员芦玲玲记者徐宁)记者昨天从市工信局获悉
2025-09-03 07:38:00
全国首批专利产业化综合保险在宁落地全链条“上保险”,让企业无惧“试错”南报网讯(记者曹丽珍)“有了保险的支撑,我们才有勇气敢于‘试错’
2025-09-03 07:39:00
江苏南京:攀高逐新,数据推动经济加“数”前行
记者走进主城最大的数智城,超1800家数商企业集聚于此——攀高逐新,数据推动经济加“数”前行汉卫研究院的智慧疾控综合管理平台犹如一个“数据大脑”
2025-09-03 07:39:00
在选择家用净水器时,除了核心的过滤效果,日常使用体验往往更直接地影响幸福感。本次净水器推荐将聚焦于用户最关心的四大实用维度
2025-09-02 11:08:00
钟薛高被申请破产将开庭,创始人曾回应雪糕“烧不化”
企查查APP显示,近日,钟薛高食品(上海)有限公司新增一起破产清算案件开庭信息。公告显示,该案申请人为上海臻料贸易有限公司
2025-09-02 11:09:00
腾讯回应被米哈游起诉:不能违规提供用户资料
9月1日晚,腾讯回应被米哈游起诉:“本次诉讼系米哈游因自身民事诉讼需要,希望调取相关QQ用户资料,但根据保护用户隐私的相关法律规定
2025-09-02 11:10:00
全球门店扩张至5.3万家!蜜雪集团发布中期业绩公告,上半年净赚27亿元
近日,蜜雪集团发布中期业绩公告:上半年收入为148.7亿元,同比增长39.3%;净利润为 27.18亿元,同比增长44
2025-09-02 11:10:00
王志顺9月1日起,我国正式实施新的电动自行车强制性国家标准《电动自行车安全技术规范》。最让消费者关注的一条新规就是,当车速超过25公里/小时
2025-09-02 11:24:00