• 我的订阅
  • 科技

ChatGPT 到底是赛博做题家还是科研颠覆者?

类别:科技 发布时间:2023-04-19 23:22:00 来源:浅语科技

除非最近彻底断网了,否则大家应该听说或体验过了目前非常流行的聊天机器人,ChatGPT。ChatGPT首次在网上发布的时间在2022年11月,并且在今年3月得到强力升级。

当我们输入一个问题、评论或指令后,ChatGPT会快速地对我们抛出的任何一个问题给出一段漂亮的回答。回答的质量很高,甚至会让你以为是人工客服给出的。ChatGPT的内核是基于一个名为“生成式预训练变换器(GenerativePre-trainedTransformer,GPT)”的语言模型构建的。通过被喂入来自各类网站和其他来源的海量文本数据,该模型最终被训练成了一个能够对使用者输入的句子或段落进行快速、智能、逻辑清晰回应的人工智能。

作为科学工作者以及科普作家,我特别希望了解ChatGPT如何处理科学以及伪科学的内容。为了解答内心的疑问,我询问了不同版本的ChatGPT对于物理学和数学中一些经过成熟讨论并得到正确结果的科学理论和伪科学理论的看法。

ChatGPT能够辨别科学理论的正确与谬误吗?

ChatGPT的最初版本,即11月公布的版本(又称GPT-3.5)认为2+2=4。当我输入“我认为2+2=5”的看法时,GPT-3.5反驳道“2+2=4”,它表示该等式遵循自然数计算的公理。它补充说:“虽然人们可以自由地拥有自己的观点和信仰,但重要的是要承认和尊重既定事实和科学证据。”然而,随着进一步的测试,情况变得更为复杂。GPT-3.5编写了正确的代数公式来求解二次方程,但无法始终如一地获得特定方程的正确数值答案。它在回答简单的问题时也会犯错,例如《华尔街日报》专栏作家乔什・尊布伦(JoshZumbru)给出的问题:“如果一根香蕉重0.5磅,而我有7磅香蕉和9个橙子,我有多少水果?”但是却没能得到正确结果。

在物理学方面,GPT-3.5表现出了广泛但未必精确的知识储备。它能够为物理课程组织一份良好的教学大纲,包含从物理学的基础理论到量子力学和相对论的内容。同时,在更高的层次上,当GPT-3.5被问及物理学中一个悬而未决的大问题——将广义相对论和量子力学合并为一个宏伟理论的难题——时,它给出了关于两种理论之间根本差异的答案。然而,当我输入质能方程“”时,GPT-3.5给出了错误的答案。GPT-3.5正确地识别了这个方程,但是错误地表示一个大质量仅能够转化为小部分能量。当我重新输入了“”这个方程时,GPT-3.5才正确地认为小质量能够产生大量的能量。

那么新版GPT-4能否克服GPT-3.5出现的如上问题呢?为了找到答案,我分别测试了两个版本的GPT-4:一个版本来自于系统的研发者OpenAI,另一个来源于微软的必应搜索引擎。微软在二月份向全网推出了内置GPT-4的搜索引擎“必应”的新版本。

一开始,我向GPT-4输入了“2+2=?”GPT-4回答“2+2=4”。当我再次向ChatGPT表明2+2=5时,GPT-4反驳道2+2=4。与GPT-3.5不同的是,GPT-4主动询问我是否知道在哪个数字系统中2+2=5成立。

当我问道“我该如何解一个二次方程”时,GPT-4演示了三种解决二次方程的方法并且对不同的二次方程都计算得到了正确的数值解。对于上文的“香蕉-橘子”问题,ChatGPT给出了正确的答案23。GPT-4同样能够解决更加复杂的文字问题。并且,不管我输入多少次,GPT-4给出的回答始终是“小的质量能够产生巨大的能量”。

ChatGPT 到底是赛博做题家还是科研颠覆者?

AI计算:ChatGPT-4目前似乎能够正确地回答一些简单的数学问题,像是2+2等于几。但是它可能无法真正地进行计算——GPT-4似乎仅能够简单地识别出经常出现在它数据库中的数据列。图片来自于s1mplelife/Shutterstock。

相较于GPT-3.5,GPT-4展示出更为丰富的知识储备以及对于物理知识的一些创造力。GPT-4能够对统一相对论以及量子力学的理论发表深刻得多的回答。我进一步询问了不同领域的问题,对ChatGPT提问“激光干涉仪引力天文台(LIGO)能够测量什么”。GPT-4解释道,LIGO是一座具有高灵敏度的大科学装置,并且在2015年第一次探测到了引力波。我为了用两个相似的词语混淆GPT-4,继续问道“那我们是否能够用LEGO(乐高)建造LIGO(激光干涉仪引力天文台)呢?”GPT-4显然没有被难倒。GPT-4精确解释了为什么乐高积木不能够用于搭建超精密LIGO。并且,GPT-4并没有因为我的愚蠢问题而嘲笑我,反而是出乎意料地回答道,用乐高积木搭建一套LIGO模型或许是一个有趣的想法。

总的来说,我发现GPT-4在某些方面已经超越了GPT-3.5的水平,但是它仍然会出现错误。当我质疑了GPT-4关于质能方程的看法时,GPT-4给出了一个非常模糊的答案,而不是直接捍卫正确的质能方程。另一项来自英国约克大学的理论物理学家马特・霍奇森(mattHodgson)的研究表明GPT-4的一些回答存在自相矛盾。作为一名经常使用GPT-3.5的用户,他同时测试了GPT-3.5和GPT-4回答更为复杂的物理和数学问题的能力,并发现了复杂类型的错误。例如,在回答有关电子量子行为的问题时,GPT-3.5给出了正确的答案,但至少在最初错误地给出了答案来源的物理方程。当问题重复时,GPT-3.5能够正确回答所有内容。当霍奇森在必应中测试GPT-4的水平时,他发现GPT-4的数学能力虽然先进但仍不完美。比如,就像我在关于二次方程的提问一样,GPT-4列出了求解物理学中重要的微分方程的有效步骤,但错误地计算了数值答案。

霍奇森这样总结GPT-3.5的能力:“我发现它能够对非常有名的物理理论中的一般问题给出精巧、可靠的答案……但它无法对特定物理领域进行详细的计算。”同样,他得出结论:“GPT-4在回答普通问题方面比GPT-3.5做得更好,但在解决给定问题方面,至少是在回答更深奥的问题方面,GPT-4仍然不可靠。”

GPT-4表现出的更为智能的对话以及解释功能得益于GPT-4 更大的数据库。(OpenAI并没有公开数据库的具体规模,只是说这个数据库是“网络规模的数据语料库”)。OpenAI指出,该数据库同时包括正确和错误的数学和推理过程。显然,额外的训练数据不足以生成完整的数学分析推理过程。正如霍奇森指出的那样,也许这是因为GPT-4的功能就像GPT-3.5一样只能够预测一串单词中的下一个单词。例如,它可能知道“2+2=4”,因为这个特定的序列经常出现在其数据库中,但是它并没有计算任何东西。

经过如上讨论,我产生了一个疑问:如果GPT-4解决科学问题的方法是不完美的,它能区分正确和错误的科学理论吗?这个答案取决于科学领域。在物理和数学领域中,我们通过与已知的物理定理及实验事实对比,可以很轻松地验证可疑的错误和伪科学理论的合理性。我通过提问GPT-3.5和GPT-4一些物理和天文学中的经典前沿问题,对GPT-3.5和GPT-4是否能够基于物理公理和实验现象分辨伪科学理论进行了验证。两个GPT版本都表示,我们没有证据表明恒星周围有巨大的外星建筑;太阳系中所有行星排成一列并不意味着地球的灾难。

但是,当被问及一些受政治化或公共政策等因素影响的科学问题时,GPT-3.5或GPT-4更难做出正确回答。因为这些科学问题本身可能还在研究中,没有明确的答案。

总的而言,GPT-4和GPT-3.5能够正确地识别关于数学和物理学的错误表述。在回答更具争议的政治化科学议题时,GPT-4会不偏袒任何一方地进行回答,并且指出这不是一个已解决的问题。必应同样给出无偏见的答案,并且通过列举出相关的新闻和实验数据作为它的论据。当必应的人工智能面对质疑它答案的片面指责性的攻击时,它采取了礼貌且不介入争执的明智策略。这些结果初步表明GPT-4能够对问题给出可靠的答案,并且有效抵御外界输入信息对于答案的影响。ChatGPT对于新冠疫情和气候变化等具有争论性科学问题的回答,以及对生物科学和其他主要科学领域的知识还值得进行进一步测试检验。

同时,ChatGPT回答科学和数学问题的答案并不完全可靠。霍奇森发现GPT-4在“为物理学(可能还有其他学科)问题提供创造性解决方案方面存在不足......它的智能仍然有些虚假。”即便如此,它对科学家也很有用。霍奇森写道:聊天机器人可以“执行消耗着用户的宝贵时间的、不需要创造力的逻辑任务。”霍奇森表示,他使用ChatGPT辅助编写计算机代码,总结电子邮件和论文的内容,以及进一步将其应用在教育领域。但他指出,对于ChatGPT的任何产品,用户都应该仔细检查其给出的结果是否符合预期。

霍奇森对ChatGPT的评价让人想起计算机先驱道格拉斯・恩格尔巴特(DouglasEngelbart)对于智能设备的看法。恩格尔巴特希望简化人机交互过程,以便计算机的强大算力能够可以无缝赋能人类智慧——这个想法被称为IA(intelligenceaugmentation),“智能增强”,而不是AI(ArtificialIntellgence),“人工智能”。恩格尔巴特在1960s发明了计算机鼠标,改善了用户和计算机之间的人机交互体验。GPT-4在人机交互过程中能够给使用者提供持续反馈,并进一步提高用户使用计算机的能力。因此可以预见,ChatGPT这类自然语言聊天机器人程序的发展是变革人机交互范式的另一个重大突破口——这种智能程序能够实现人与计算机的双向交流。在真正的AI出现之前,将GPT-4作为一项智能增强辅助工具能够实现使用者和智能程序的互惠互利。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-04-20 05:45:32

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

霍奇森:妻子的支持让我重新拿起教鞭,联赛中的胜利比杯赛重要
霍奇森:妻子的支持让我重新拿起教鞭,联赛中的胜利比杯赛重要直播吧9月15日讯 据《泰晤士报》报道,霍奇森近日接受了记者的采访,在采访中他谈及了执教水晶宫的选择。关于执教水晶宫我很
2023-09-15 11:00:00
邮报:霍奇森病情稳定且正在好转,水晶宫已经开始规划新的篇章
2月19日讯据《每日邮报》报道,霍奇森目前病情正在好转并且恢复状况良好,水晶宫也正在规划他们的下一个篇章。有些人批评水晶宫任命格拉斯纳的决定有些草率,但其实在霍奇森出现健康问题之
2024-02-19 12:25:00
记者:水晶宫与格拉斯纳继续谈判,霍奇森被解雇只是时间问题
...天继续与格拉斯纳进行谈判,俱乐部希望邀请他顶替老帅霍奇森。这位记者表示:“今天,水晶宫和奥利弗-格拉斯纳就接替罗伊-霍奇森继续进行谈判,据了解,格拉斯纳希望得到约400万英镑
2024-02-15 17:00:00
TA:相关人士认为霍奇森训练缺乏强度,导致水晶宫大面积伤病
直播吧2月20日讯 水晶宫已经官宣霍奇森辞职,The Athletic撰文谈到了霍奇森离职的内部,该文表示,水晶宫相关人士认为霍奇森的训练缺乏强度,导致球队出现大面积伤病。去年夏
2024-02-20 13:00:00
霍太公宣布“病退”,英伦足球告别最后的“活化石”
76岁零195天,上周在训练中突感不适就医的“古稀老帅”霍奇森,承认廉颇老矣,主动交出了水晶宫队帅印。这次病退,恐怕球迷们都很难有机会再在教练席看到他的身影。同样在古稀之年离开教
2024-02-21 16:20:00
瓜帅:霍奇森仍执教因充满激情,青训得到认同十分重要
...得很好,他们一直保持着竞争力,不管是维埃拉还是现在霍奇森执教都是如此,尤其是现在霍奇森带队。如何看待霍奇森在这个年纪还继续执教?你永远不知道一个人会如何。他的内心依然充满着激
2023-12-18 11:47:00
杜库雷可能赛季报销,霍奇森:冬窗优先考虑补强中场位置
12月3日讯水晶宫主帅霍奇森出席新闻发布会表示,球队冬窗优先考虑补强的位置是中场。杜库雷在对阵卢顿的英超比赛中跟腱断裂,可能赛季报销,而埃泽脚踝受伤,对此霍奇森在发布会上说道:“
2023-12-04 10:51:00
约克:主教练应该有强制退休年龄,霍奇森70岁当足球总监更合适
...访,他认为主教练应该有一个强制退休年龄。水晶宫老帅霍奇森日前离任,但在退位之前,他因为健康问题一度入院。约克说道:“霍奇森在他的生涯中以及他在足球运动中所做的一切绝对是伟大的
2024-02-24 00:49:00
霍奇森谈富安健洋红牌:只能接受规则,但角色互换我也会不满
...结束的比赛,水晶宫0-1负于阿森纳。赛后,水晶宫主教练霍奇森谈到了富安健洋的第二张黄牌,他表示大家只能接受规则,但如果角色互换,他也会感到不满。谈球队表现"我们在今天的比赛中
2023-08-22 18:55:00
更多关于科技的资讯:
小米SU7爆燃遇难者母亲清空事故相关微博
快科技4月3日消息,日前,“小米SU7高速上爆燃致3人遇难”事件引发社会关注。今日,查询事故遇难者母亲“诗雨370491153”微博发现
2025-04-03 00:41:00
本文转自:人民日报海外版本报石家庄电(记者史自强)近日,2024河北省海外人才技术项目创新创业大赛总决赛暨颁奖仪式在石家庄市举办
2025-04-03 05:33:00
本文转自:人民日报第十二届中国网络视听大会上AIGC成为热议话题AIGC来了,影视创作准备好了吗?(解码·文化市场新观察)本报记者 刘 阳近日举办的第十二届中国网络视听大会上
2025-04-03 05:55:00
本文转自:人民日报刘涓溪研发中空纤维反渗透膜,建成国内首条反渗透复合膜生产线,研制海水淡化工程应用的反渗透组件……50余年来
2025-04-03 05:55:00
本文转自:人民日报【案情】某视频公司委托某榕公司根据该视频公司提供或确认的微短剧剧本,制作单集时长不超过3分钟的视频短剧
2025-04-03 06:15:00
加快技术创新  促进产业升级
本文转自:人民日报约1000家中国企业参展2025年汉诺威工业博览会加快技术创新 促进产业升级本报记者  刘仲华 徐 馨中国企业制造的人形机器人成为2025年汉诺威工博会的明星产品
2025-04-03 06:17:00
创新“膜”法,向海洋要淡水(讲述·一辈子一件事)
本文转自:人民日报中国工程院院士高从堦50余年研究海水淡化——创新“膜”法,向海洋要淡水(讲述·一辈子一件事)本报记者  顾 春高从堦(后排左)在指导学生做实验
2025-04-03 06:32:00
霸榜全球开源模型前三杭州日报讯 4月2日,全球AI开源圈炸锅了——杭州的3个大模型直接包揽Hugging Face榜单前三
2025-04-03 06:49:00
跨境电商出口平台数占全国三分之二杭州日报讯 在商业领域,资本流向往往是市场潜力的风向标,跨境电商正吸引各方投资者与资本市场的关注
2025-04-03 06:49:00
华为Pura X真的适配好了吗 我看鸿蒙玩得挺嗨的
不出意外的话,这几天大家应该都被华为Pura X 给刷屏了吧?前两天托尼也给大家聊了很多这机子的上手体验,文章发布以后
2025-04-03 07:11:00
国补价3699元起!小米15/Pro全系降价:最高降500元
每年的4月6日是米粉节,今年米粉节将至,对应的活动已经悄然开启。小米15和小米15 Pro迎来官方降价,最高降价500元
2025-04-03 07:11:00
运气爆棚!湖南一男子花4元买彩票中了1242万元:购彩需要理性
4月3日消息,近日,湖南邵阳县一彩民,以一张4元双色球彩票喜中双色球一等奖,2注共计1242万元。3月31日下午,有关单位为该投注站业主颁发奖牌
2025-04-03 07:11:00
苹果CEO蒂姆·库克套现股票:获利2400万美元
快科技4月3日消息,根据提交给美国证券交易委员会的一份文件,苹果首席执行官蒂姆·库克(Tim Cook)今天通过出售苹果股票获利超2400万美元(约1
2025-04-03 07:11:00
郑州一店把碰一下贴到招财猫上 支付宝:他才是喵机的爹
快科技4月3日消息,在河南郑州,有一家充满趣味的“火烧夹一切”小店,店里的老板堪称“创意鬼才”。他竟然把一张支付宝碰一下贴到了招财猫身上
2025-04-03 07:11:00
刘洋 云南省红河哈尼族彝族自治州个旧市发展和改革局摘要:本文基于数字治理视角,从技术应用、工作流程和制度调整、人才建设四个方面探讨档案管理转型的工作要点
2025-04-03 07:30:00