• 我的订阅
  • 科技

AI大模型参加高考 GPT-4o文科成绩最好 理科普遍不行

类别:科技 发布时间:2024-06-27 19:06:00 来源:卓越科技

【CNMO科技消息】近几天,各省2024高考成绩陆续公布,不少高分学霸也开始登上热搜受到网友们膜拜。而有媒体近日举办了一项“另类高考”,让近两年大火的AI大模型来模拟考生作答高考试题,看它们的表现究竟如何。

AI大模型参加高考 GPT-4o文科成绩最好 理科普遍不行

从该媒体公布的最新发布高考新课标Ⅰ卷大模型评测报告中,GPT-4o以562分排名文科总分第一。国内产品中,字节跳动旗下的豆包拔得头筹,成绩是542.5分。根据介绍,本次大模型高考评测与河南省考卷完全相同,而河南高考录取分数线显示,文科本科一批录取分数线为521分,豆包等三款国产AI成功冲上一本线。根据最新河南高考分数段统计数据,GPT-4o的562分在文科考生中排名8811名,相当于人类考生的前2.45%,豆包则处于前4.27%的位置。

AI大模型参加高考 GPT-4o文科成绩最好 理科普遍不行

语文作为文科的重要组成部分,是大模型与人类考生展开激烈竞争的舞台。国产大模型凭借对中文语言的独特理解和处理能力,表现可圈可点。百小应、字节豆包和腾讯元宝占据了前三的位置。英语考试中,大模型在阅读和语言运用等客观题上展现出了较高的水平,GPT-4o、百小应、通义千问等甚至获得了80分的满分,豆包和文心4.0也接近满分。但在40分的写作考试中,最高分仅为29分,由GPT-4o和百小应获得。

不过在理科方面,大模型的水平相比人类顶尖考生的差距就有点过大了。大模型的理科最高分还不到480分,多数大模型的理科总分在400分以下。在数学考试中,9款大模型产品中仅有GPT-4o、文心一言4.0和豆包获得60分以上的成绩(满分150分)。在化学和物理考试中,情况更为严峻,平均分数分别只有34分和39分。化学单项最高分49.5分由豆包获得,而GPT-4o仅有42分。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-27 21:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...测试中的得分冲上了“一本”线。与文科相比,大模型的理科成绩要差很多,最高分还不到480分,多数大模型的理科总分在400分以下,数学普遍不及格,相比河南理科511分的“一本”线
2024-06-26 11:14:00
9.11比9.9大?多个大模型翻车!业内人士:就是偏科,文科强理科弱
...格水平。尽管在语文、英语两科上能获得高分,大模型的理科最好成绩还无法进入人类考生的前30%。针对大模型答数学题普遍“吃瘪”的问题,国内某头部大模型负责人就曾表示,大模型的指令
2024-07-17 20:56:00
成都一女生高考712分,查完分就睡觉,妈妈:没有觉得特别意外,是她平时的成绩
...中(林荫校区)高三8班的张蓝月同学,在2023年高考中,理科取得712分(裸分)。对于孩子考取的优异成绩,张蓝月妈妈郑女士表示在10点多登录系统查到分数后,并没有觉得特别意外
2023-06-24 14:16:00
...理工类150分2021年陕西普通高考分数线一本:文科499分,理科443分 二本:文科406分,理科341分高职(专科)
2024-06-24 14:22:00
河南一本上线155883人,600分及以上共有25623人,理科23638人!
...今年河南考生共有155883人达到一本线,其中文科25688人,理科130195人,而通过查询今年2024年河南一本文科的录取分数线为521分
2024-06-25 11:57:00
...的不竭动力。日前,记者面对面采访了自贡衡川实验学校理科考生王珍璐、富顺二中文科考生葛佳妮,听她们分享学习方法,讲述高考经验。理科考生王珍璐做好学科计划很重要2023年高考放榜
2023-06-27 08:05:00
欢迎报考南阳师范学院
...学本科4文理兼招97政治学与行政学本科4文科50化学本科4理科115化学(地方专项计划)本科4理科5化学(中外合作办学)本科4理科120应用化学本科4理科49材料化学本科4理
2023-06-27 03:53:00
...科(含省内院校本科预科、省内专项计划)、专科434分。理科:本科(含省内院校本科预科、省内专项计划)、专科398分。注:考生填报藏汉双语授课的招生计划志愿,投档成绩计算方法为
2024-06-25 05:37:00
...立马面对的就是文理分科。最为纠结的就是学文科还是学理科呢?其实我的心里是清楚的,其时理化对我来说无异于天书,文科多少还能考到一些分数。父亲坚持让我学理科,我想那是因为父亲不知
2024-06-02 10:09:00
更多关于科技的资讯: