• 我的订阅
  • 社会

9.11比9.9大?多个大模型翻车!业内人士:就是偏科,文科强理科弱

类别:社会 发布时间:2024-07-17 20:56:00 来源:当代先锋网

近日,在新一期的《歌手》节目中,孙楠与外国歌手的微小分数差异,引发了网友关于13.8%和13.11%谁大谁小的争论。

有网友竟给出“13.11%大于13.8%”的错误答案。当时就有网友提出,自己不会的话,“实在不行问问AI呢”?结果显示,不少AI还真的不行。

第一财经记者拿“9.11和9.9哪个大”的问题一一测试了ChatGPT以及目前国内的主流大模型,包括阿里、百度等5家大厂模型,月之暗面等6家AI独角兽的模型。阿里通义千问、百度文心一言、Minimax和腾讯元宝4家大模型答对,其他8家则答错。

9.11比9.9大?多个大模型翻车!业内人士:就是偏科,文科强理科弱

首先是目前全球公认第一梯队的大模型ChatGPT,在被问到“9.11和9.9哪个大”时回复称,小数点后面的数字“11大于9”,因此9.11大。

记者追问ChatGPT有没有其他比较方法,它将小数转化成分数比较,得出 “11/100比90/100小”,这一步是对的,但它接着下结论称“因此9.11比9.9大”。

9.11比9.9大?多个大模型翻车!业内人士:就是偏科,文科强理科弱

大模型这一算术问题最开始被艾伦研究机构(Allen Institute)成员林禹臣发现,他在X平台上发布的截图显示,ChatGPT-4o在回答中认为13.11比13.8更大。“一方面AI越来越擅长做数学奥赛题,但另一方面常识依旧很难。”他表示。

这类大模型说胡话的现象,在业界被称为大模型出现幻觉。此前,哈尔滨工业大学和华为的研究团队发表的综述论文认为,模型产生幻觉的三大来源:数据源、训练过程和推理。大模型可能会过度依赖训练数据中的一些模式,如位置接近性、共现统计数据和相关文档计数,从而导致幻觉。此外,大模型还可能会出现长尾知识回忆不足、难以应对复杂推理的情况。

值得一提的是,此前,“Al高考测试最高分303”话题也曾火上热搜,引发了社会各界对AI教育能力的深入思考和讨论。

以数学试卷为例,9款大模型产品中,仅GPT-4o、文心一言4.0和豆包获得60分以上成绩(满分150分),目前的大模型只能正确推理步骤相对简单的问题。

9.11比9.9大?多个大模型翻车!业内人士:就是偏科,文科强理科弱

与人类顶尖考生相比,大模型在数学、物理、化学等数理学科上差距极大,包括GPT-4o在内的所有大模型都无法达到及格水平。尽管在语文、英语两科上能获得高分,大模型的理科最好成绩还无法进入人类考生的前30%。

针对大模型答数学题普遍“吃瘪”的问题,国内某头部大模型负责人就曾表示,大模型的指令遵循或者说推理能力通常是把一个指令背后的意思拆解出来,但数学题既包含规则性,又包含对各种思维的考察,解题逻辑和正常用大模型时的推理逻辑不一定完全一样。

同时该负责人还提到,从更广泛的大模型应用角度来看,AI能不能精准遵循指令是近一段时间内比较重要的事情,真正的商业价值也比较大可能来自于此,而解数学题对目前的AI来说还是一件比较“炫技”的事情。

另有业内人士向南都记者表示,目前来看大模型的数理能力相对较差的情况在中外都是一样的,“打个比方可以这样讲,大模型就是偏科,文科强理科弱,这个情况在一段时间内也不会得到明显的改善”。

来源 北京商报

编辑 王小婷

二审 杨韬

三审 刘丹

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-18 05:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

大模型像“文科生”?业内人士在沪“论战”
...上海站活动上,不仅网友在线上看直播时发出质疑声,连业内人士也“吵”起来了。4月14日,“知乎AI先行者沙龙”上海站活动在沪举行。中新网记者 郑莹莹 摄在浙江大学计算机学院研究
2024-04-15 22:01:00
本文转自:鲁中晨报专家点评GPT-4:数学不太好的文科生业内人士如何看待这个多模态预训练大语言模型?记者采访了上海交通大学教授、自然语言处理专家赵海。“读图编程”表演令人惊艳赵海
2023-03-16 09:23:00
AI大模型参加高考 GPT-4o文科成绩最好 理科普遍不行
...考试中,最高分仅为29分,由GPT-4o和百小应获得。不过在理科方面,大模型的水平相比人类顶尖考生的差距就有点过大了。大模型的理科最高分还不到480分,多数大模型的理科总分在
2024-06-27 19:06:00
...测试中的得分冲上了“一本”线。与文科相比,大模型的理科成绩要差很多,最高分还不到480分,多数大模型的理科总分在400分以下,数学普遍不及格,相比河南理科511分的“一本”线
2024-06-26 11:14:00
这一职业,突然爆火!简历刚投,就被“抢光”……
...节后至今,数据标注类岗位招聘职位数量同比增长达56%。业内人士表示,随着大语言模型的快速发展,以及涉及的领域越来越多,人工智能训练师的需求还会继续增加。人工智能训练师:数字时
2025-03-31 07:58:00
当小白花进攻硅谷,马斯克们疯狂颤抖?
...适合这个领域,天花板不高。特别是在东亚人的思维中,理科代表逻辑,文科代表情绪。而这几年AI迅速崛起,全球都在卷科技,文科无用论又成为互联网导向了。说文科正在世界内消亡的,说文
2024-12-31 12:34:00
...科生的报考比例、招生比例都下降了10%左右,录取率仅有理科生的一半。随着复旦大幅度缩减文科生招生计划,冲锋号响了,相信文科生减少会更加迅猛。01复旦也扛不住了最近复旦大学缩减
2025-03-29 17:29:00
...。赵海解释:“过去,ChatGPT等大模型像文科生,不擅长理科和逻辑推理。而对人类智慧来说,最底层的智慧是逻辑,逻辑之上是数学,再上面是物理、化学等科学。”去年9月,Open
2025-01-29 21:29:00
本文转自:中国经济网来源:中国经济网医疗一直都是人工智能应用的重要领域,人工智能已经在过去几年内陆续落地,并在病历书写、报告生成、病例归纳、辅助决策、论文润色等医疗场景内取得了广
2023-07-07 17:23:00
更多关于社会的资讯:
友好城市青年说丨喃们保定着(zhāo)得(děi)!来听他们的心里话
2025-04-02 11:05:00
石家庄市长安区:刘月卯书法家工作室举办上巳雅集活动
3月30日,刘月卯书法家工作室在石家庄市长安区举办“游目骋怀——刘月卯书法家工作室上巳雅集活动”。现场,书法家们与社区居民共同吟诵经典《兰亭序》
2025-04-02 11:06:00
晋州市开展“晋图讲堂”讲座活动
河北新闻网讯(邢园园、宋家逸)3月30日,晋州市文化馆举办的“晋图讲堂”在晋州市融媒中心正式开讲。此次讲座的主讲人是瑞涵九力书房创始人涵涵校长
2025-04-02 11:09:00
齐鲁晚报·齐鲁壹点 记者 王颖颖 牟静萍 刘振宇3月的威海还有点冷,站在塔山南坡向南望去,山顶上盖着一层积雪,在山风的加持下冬意犹在
2025-04-02 11:12:00
山东肥城入室抢婴案将于4月2日在泰安市中级人民法院一审开庭。2006年,山东肥城一名出生仅8个月的男婴姜甲儒正在爷爷家睡觉
2025-04-02 11:13:00
“字节跳动创始人张一鸣加入新加坡国籍啦?”这是今早老丁在翻看微信朋友圈时,不少朋友发出的疑问。要说这也不是围绕张一鸣国籍的首次纷扰
2025-04-02 11:13:00
问政海南 | 停工近一年,项目安全隐患重重……海口一小区加装电梯困难重重
点击进入“问政海南”栏目南海网4月2日消息(记者 易帆)“小区16栋单元楼加装电梯已经全面停工半年,远超合同工期一年半
2025-04-02 11:43:00
抽查不合格,青岛市泰星电缆等企业被通报
近日,山东省市场监督管理局公布2024年电线电缆产品质量省级监督抽查结果。2024年第1批产品质量省级监督抽查共抽查电线电缆产品184批次
2025-04-02 11:44:00
沈阳市公安局悬赏5万元的刑案通缉犯姜龙已被抓
3月23日,沈阳市公安局发布悬赏通告,2025年3月21日凌晨,沈阳市发生一起刑事案件,经查,姜龙有作案嫌疑,目前在逃
2025-04-02 11:49:00
南海网版权声明:以上内容由南海网原创生产,未经书面许可,任何单位及个人不得以任何方式或理由对上述内容的任何部分进行使用
2025-04-02 11:54:00
以你之名丨续写这本“钉子”日记
编者按:从“铭记你”到“追随你”,再到努力“成为你”——这是一场跨越时空的精神接力。2025年清明节期间,河南文明网联合大河网推出清明节主题策划《以你之名》
2025-04-02 11:56:00
珍爱网有线下门店关闭 关注婚恋平台诚信“欠费”
中国消费者报报道(记者王小月)进入3月以来,珍爱网有线下门店在未提前告知会员的情况下突然关闭,引发付费会员集体投诉。网络上
2025-04-02 11:56:00
济南平阴法院发出首份《预查废证明》
齐鲁晚报·齐鲁壹点 栾海明 通讯员 赵芳近日,济南市平阴区人民法院(以下简称“平阴法院”)发出首份《预查废证明》,正式启动涉金融案件“预查废”机制
2025-04-02 12:18:00
浪漫威海清明礼遇,西霞口给你不一样的春日限定
齐鲁晚报·齐鲁壹点 连宁燕清明节假期即将到来,当数万只海鸥飞抵威海,这场春日限定的蓝色芭蕾已拉开帷幕。面向威海市民、全国大学生
2025-04-02 12:18:00
两年四名毕业生考入西安交大少年班 学生老师校长都说:规划很重要
朱周悦(左三),曾是长青小学篮球队队长,今年考入西安交大少年班2024年,三名长青小学毕业的学生考入西安交大少年班;2025年
2025-04-02 12:27:00