• 我的订阅
  • 科技

人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代

类别:科技 发布时间:2023-02-24 18:22:00 来源:浅语科技

人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代

大型语言模型(LLMs)是指采用机器学习技术,利用大量文本数据进行训练,以能够自然地理解和生成自然语言文本的人工智能模型。这些模型可以用于自然语言处理任务,如文本分类、文本生成、语言翻译、问题回答和摘要生成等。最近几年,由于深度学习技术的进步,大型语言模型已经取得了令人瞩目的成就,例如OpenAI的GPT系列模型和Google的BERT模型等。这些模型似乎具有人类的智力和创造力。他们对书面问题提供详细而清晰的回答。

几十年来,数学家一直试图将证明转化为计算机代码,这一过程被称为形式化。如果你把证明写成代码,计算机运行代码时没有错误,你就知道证明是正确的。但证明一个命题可能需要数百或数千个小时。

在过去的五年里,人工智能研究人员已经开始教LLMs自动将数学语句形式化。LLMs已经可以将一种自然语言翻译成另一种自然语言。但从数学到代码的转换是一个艰巨的挑战。

人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代

尽管LLMs在自然语言处理等领域取得了很大的成功,但是它们也存在一些问题:

数据偏差:LLMs的性能取决于其训练数据。如果训练数据存在偏差,模型就会学到这些偏差,从而影响其性能。

偏见:LLMs可能会从其训练数据中学习到偏见,并将这些偏见反映在其生成的文本中。这可能导致出现歧视性语言或错误的陈述。

知识表示:LLMs没有真正的理解语言或世界的知识,它们只是学习出现在数据中的模式。这意味着它们可能会在处理新的情况时出现问题。

模型大小:LLMs需要大量的计算资源和存储空间,以及大量的训练数据。这使得训练和部署成本非常高。

环境依赖性:LLMs的性能取决于输入的上下文和环境。如果输入的数据与训练数据不同,它们可能会产生错误的输出。

基于上述问题,这些模型有时会做出不合逻辑的陈述,或者自信地把谎言说成事实。谷歌AI的吴宇怀表示:“我们不想创建一个像人类一样说话的语言模型,我们想让它明白自己在说什么。”

人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代

吴是最近两篇论文的合著者,这两篇论文提出了一种实现这一目标的方法。它们是关于一个非常具体的应用的:训练人工智能系统做数学。

人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代

第一篇论文描述了如何教LLM将普通的数学语句转换为计算机可以运行和检查的正式代码。第二篇训练LLM不仅要理解自然语言数学问题,而且要使用一个名为Minerva的系统实际解决这些问题。

Minerva指的是一个用于解决数学问题的系统,它是一个组合了自然语言处理和数学推理的系统。这个系统的作用是帮助计算机理解自然语言中的数学问题,从而能够通过推理和计算得出问题的答案。具体来说,这个系统包括多个子系统,包括自然语言处理、问题建模、数学知识库和推理引擎等。通过这些子系统的协作,Minerva能够有效地解决自然语言数学问题。

总之,这些论文提出了未来人工智能设计的蓝图,LLM可以通过数学思维学习推理。

人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代

研究人员主要使用名为Codex的LLM(基于GPT-3)。为了让Codex能够很好地理解数学,从而实现自动形式化,他们只提供了两个自然语言数学问题示例及其正式代码翻译。在简短的训练之后,Codex给出了来自高中比赛的近4000道数学题目的自然语言陈述。起初,Codex准确率略低于30%。当它失败时,它创造了一些术语来填补翻译词典的空白。

在此研究之前,Codex从未尝试在自然语言和形式数学代码之间进行翻译。但Codex通过在GitHub上的培训熟悉代码,也熟悉互联网上的自然语言数学。在此基础上,研究人员只需向它展示几个他们想要的例子,Codex就可以开始连接这些点了。

研究人员不仅试图教LLMs如何翻译数学问题,而且还试图教他们如何解决问题。

Minerva数学

人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代

第二篇论文虽然独立于早期的自动形式化工作,但也有类似的风格。谷歌的研究团队训练了一种LLM来详细回答高中竞赛级别的数学问题,例如“平行于y=4x+6的直线经过(5,10),这条直线与y轴交点的y坐标是多少?”

作者从一个名为PaLM的LLM开始,它已经接受了一般自然语言内容的训练,类似于GPT-3。他们将这个增强模型命名为Minerva。

人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代

研究人员向Minerva展示了他们想要的四个例子。然后他们在一系列定量推理问题上测试了这个模型。Minerva的表现因科目而异:在某些科目如代数上,它的正确率略高于一半,而在其他科目如几何上则略低于一半。

作者们担心的一个问题是Minerva正确回答问题只是因为它已经在训练数据中看到了这些问题或类似的问题。这个问题被称为“污染(pollution)”,它使得人们很难知道一个模型是真正在解决问题,还是只是在复制别人的工作。

为了防止这种可能性,研究人员让Minerva参加了波兰的2022年国家数学考试,它答对了65%的问题。这表明训练有素的模型具有解决数学问题的能力。

尽管Minerva的工作令人印象深刻,但它带有一个严重的问题,作者也指出了这一点:Minerva没有办法自动验证它是否正确地回答了问题。即使它确实正确地回答了一个问题,它也不能检查它所采取的步骤是否有效。

人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代

换句话说,Minerva它不能检查它的工作,这意味着它需要依靠人类的反馈来变得更好。因此,研究人员怀疑这种方法能否扩大到复杂问题上。

吴指出,一方面,如果你研究自然语言或Minerva类型的推理,有很多数据可以利用——整个数学互联网,但本质上你不能用它进行强化学习。另一方面,像Isabelle/HOL这样的证明助手提供了一个基础的环境,但几乎没有数据可供训练。我们需要某种桥梁把它们连接起来。

自动形式化就是那个桥。自动形式化的改进可以帮助数学家在编写证明和验证工作正确性方面实现自动化。

通过结合这两篇论文的进步,像Minerva这样的系统可以首先自动形式化自然语言数学问题,然后解决它们,并使用证明助手检查它们的工作。这种即时检查将为强化学习提供必要的反馈,使这些程序能够从错误中学习。最后,他们会得到一个可证明的正确答案,并附带一系列逻辑步骤——有效地结合了LLM和强化学习的力量。

人工智能研究人员还有更广泛的目标。他们认为数学是开发人工智能推理技能的完美证明,因为它可以说是所有推理任务中最难的。按照这种想法,如果一台机器能够有效地进行数学推理,那么它自然应该获得其他技能,比如编写计算机代码或提供医疗诊断的能力。

人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代

但是仍然有一些工作是目前的人工智能所无法替代的的,例如:

艺术创作:创造真正的、有创意的艺术作品需要人类的创造力和情感体验的。

心理治疗:面对严重的心理问题,人类专业心理医生提供的治疗和支持无法被取代。

体力劳动:虽然有机器人可以执行一些体力劳动工作,但是执行某些复杂的任务仍然需要人类的技能。

社交关系:建立和维护人际关系需要人类的情感和社交技能。

总之,在许多领域中,人类的情感、判断和创造力是无法被替代的。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-02-24 19:45:11

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

《中国人工智能简史》:数学家翻开了中国人工智能研究的第一页
...代点之一。相比1979年所开启的波澜壮阔的新时代,中国人工智能(Artifcial Intelligence,AI)研究在1979年的起步只能算历史大潮中的一朵不起眼的浪花
2023-09-04 16:58:00
人工智能数学基础:解锁智能世界的十大密钥
在人工智能的浩瀚海洋中,数学基础是不可或缺的重要支柱。它不仅是理解算法原理的钥匙,更是实现技术创新的关键。掌握人工智能数学基础,就如同手握一把解锁智能世界的密钥,让我们能够深入探
2024-04-24 12:02:00
西湖大学新增数学与应用数学、人工智能两个本科专业
...20日,记者从西湖大学获悉,该校新增数学与应用数学、人工智能两个本科专业,并列入西湖大学2024年本科招生计划,这意味着今年西湖大学本科生招生专业增至7个。近日,教育部公布了
2024-03-20 20:38:00
2024年世界人工智能大会“数学与人工智能”学术会议在沪举办
本文转自:人民网-上海频道近日,2024年世界人工智能大会期间,由斯梅尔数学与计算研究院主办的“数学与人工智能”学术会议在上海世博中心举办。来自全球多位知名数学家和科学家围绕机器
2024-07-10 22:53:00
...辑思维的提升,数学都发挥着不可替代的作用。尤其是在人工智能深度赋能千行百业,影响力与日俱增的当下,数学这门基础学科的发展和本土创新人才的培养,始终是科学界和教育界关注的焦点。
2025-03-17 13:06:00
本文转自:北京晚报数学卷创设真实情境新质生产力人工智能入题本报讯(记者李祺瑶 牛伟坤)新质生产力、人工智能、生态环境保护……昨天,初中学业水平考试数学科目结束,考生们对试卷中贴近
2024-06-25 13:48:00
作为一名高中生,我深切地感受到人工智能时代的浪潮正深刻地改变着我们的学习方式,尤其是在数学学习上。数学,这门充满逻辑与美感的学科,曾让我既敬畏又着迷。在人工智能的助力下,我找到了
2025-02-15 05:29:00
好未来自研数学大模型MathGPT开启内测 用AI实现因材施教
...新了一个具有代表性和挑战性的数学任务评测集,供全球人工智能专家、数学爱好者体验和测评。田密介绍,希望让MathGPT在数学教育领域发挥更大作用,好未来愿意把基于大规模、高质量
2023-08-24 19:02:00
从个性化到情绪智能,揭秘美国AI教育产品的市场霸主之路
...创新无疑有很多值得学习和借鉴的地方。美国很早就针对人工智能技术可能对教育带来的影响提出了两方面的战略:第一,可以通过将人工智能技术应用于教学环节,为学生提供个性化教学服务,提
2024-06-29 09:29:00
更多关于科技的资讯:
这一年,杭产机器人忙着进化忙着上岗
宇树机器人化身武林高手亮相春晚“这才一年,太震惊了!”昨晚的央视春晚上,宇树机器人和河南塔沟武术学校带来的《武BOT》一亮相
2026-02-17 07:17:00
新春走基层|总台春晚这条“骐骥驰骋”红色羊绒围巾出自河北品牌
见习记者于歆2026年总台春晚舞台上部分演员及嘉宾佩戴的“骐骥驰骋”红色羊绒围巾,出自河北品牌!由邢台市清河县的河北红太集团生产
2026-02-17 01:36:00
阿里发布千问3.5,性能媲美Gemini 3, Token价格仅为其1/18
2月16日除夕当天,阿里巴巴开源全新一代大模型千问Qwen3.5-Plus,性能媲美Gemini 3 Pro,登顶全球最强开源模型
2026-02-16 17:34:00
海信冰箱联手央视《探班春晚》 用真空保鲜科技“锁住年味”
鲁网2月16日讯2月16日,作为央视新闻新媒体《探班春晚》的独家家电合作伙伴,海信冰箱携真空保鲜科技亮相“春晚会客厅”
2026-02-16 18:47:00
余杭文化“新三样”扬帆 驶向全球文化蓝海
《长安三万里·梦回大唐》获金鸡虚拟现实电影季“年度最佳艺术表现奖”。后亚运时代,杭州如何将因赛会集聚的国际目光,转化为持续的城市发展动能
2026-02-16 11:33:00
北京亦庄与它石智航达成战略合作!共建产业新高地
2026年伊始,具身智能产业持续加速发展。2月14日,北京亦庄与它石智航达成战略合作,双方将在具身智能关键技术攻关、应用落地和产业生态建设方面展开合作
2026-02-16 08:21:00
厦门网讯(厦门日报记者 林露虹)马年春节假期,厦门科技企业的“电子年货”火热上线。在厦门过年,市民和游客可以请AI当导游
2026-02-16 08:40:00
自2025年夏季,京东、美团、阿里等数字平台企业相继开启围绕即时零售市场的激烈争夺。这场“闪购大战”,初期以各方投入“天价补贴”争抢流量而引发社会广泛关注
2026-02-16 08:53:00
马年新春,光景别样。打开手机AI小程序,输入姓名、爱好与新年心愿,一键可生成专属春联。AI深度融入日常生活,无所不在。拥抱AI
2026-02-16 07:39:00
鲁网2月15日讯在人工智能加速重构产业组织形态的背景下,“一人即公司”(OPC)正成为全球创新创业的新范式。2026年2月12日
2026-02-15 20:48:00
石家庄市栾城区妇联举办美妆技能培训
河北新闻网讯(王秀平、李明发)近日,石家庄市栾城区妇联联合妆颜美化妆培训学校,精心举办了一场干货满满的美妆技能培训活动
2026-02-15 19:16:00
英科医疗开年首展登录迪拜WHX展会,“中国智造”医疗解决方案亮相全球市场
2月9日至12日,全球领先的医疗护理产品供应商英科医疗携三大事业部创新成果亮相阿拉伯国际医疗器械展览会(World Health Expo Dubai)
2026-02-15 13:50:00
龙岗文旅数字IP城市巡礼破圈传播,迎春花市成内容热点
市民围观、拍照打卡,数字人引爆春节花市春节前夕,龙岗迎春花市迎来一场特别的巡礼:数字IP首次在花市与市民面对面互动。现场
2026-02-15 13:52:00
近日,中亦科技收到了一封来自大众汽车的感谢信。信中对中亦科技服务团队在应对大规模生产系统突发故障时的卓越表现,以及长期以来展现出的专业素养和“以客户为中心”的担当精神给予了高度评价
2026-02-15 10:23:00