• 我的订阅
  • 科技

用AI来做全国高考试卷,真的有人试了!结果:成绩偏科很严重

类别:科技 发布时间:2024-06-26 22:29:00 来源:卓越科技

最近两年,ChatGPT的火热催生了一大批AI大模型,让大家对于生成式AI的能力,可谓是又惊讶又担心,引发大家的担忧,担心自己的工作、技能会被AI取代!

而高考这样的知识性的测验,就很适合AI大模型去做测试,如果用AI来代替学生去高考,会怎么样?

用AI来做全国高考试卷,真的有人试了!结果:成绩偏科很严重

欸,还真的有人试了。

上海人工智能实验室近日公布了司南评测体系OpenCompass选取开源大模型测试今年高考的全国新课标I卷“语数外”的结果,为了确保“闭卷”考试,大模型的开源时间早于高考,同时邀请有高考评卷经验的教师人工批卷。

选取的大模型分别是OpenAI的GPT-4o、法国的Mixtral8x22B、零一万物的Yi-1.5-34B、智谱AI的GLM-4-9B、上海人工智能实验室的InternLM2-20B-WQX以及阿里巴巴的Qwen2-57B和Qwen2-72B。

用AI来做全国高考试卷,真的有人试了!结果:成绩偏科很严重

结果成绩最好的是阿里巴巴Qwen2-72B大模型,满分420分的情况下,总分达到了303分;排在第二名的是GPT-4o,获得296总分;排在第三位的InternLM2-20B-WQX,总分在295.5分,成绩还算不错。

但是7款大模型有一个共通问题,就是偏科严重!

语文、英语此类的语言类型的测试,成绩相对都要好一点,语文平均得分率为67%,英语更是达到了81%。而数学偏向于计算、公式计算的测试,7款大模型的测试成绩都比较差,甚至最低的仅有21分,最高的也仅有75分,虽然记住了公式,但是不能灵活应用。

用AI来做全国高考试卷,真的有人试了!结果:成绩偏科很严重

显然,现阶段来说大模型还待提升的空间,对于这样的测试结果,大家还满意吗?

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-27 09:45:31

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...。如果让大模型和国内学子同台竞技,做同一套高考真题试卷,结果会是怎样?大模型考上文科本科,豆包获国内头筹在极客公园最新发布的高考新课标Ⅰ卷大模型评测报告中,GPT-4o以56
2024-06-26 11:14:00
...”。首先,LLMEVAL团队选取了2024年高考新I卷、新II卷数学试卷的客观题(单选、多选和填空题,共73分)来评测,得出了不同的结论。使用客观题测试大模型的好处是,对就是
2024-06-26 07:26:00
名师点评河南高考物理丨整体难度适中 对计算能力有一定要求
...合性相结合,充分体现了新课标和核心素养的要求。一、试卷整体分析物理试卷共100分,其中力学6道,电磁学6道,光学1道,热学1道,近代物理1道,考点分布非常合理。分数上力学39
2025-06-08 19:13:00
高考泄密案:考生潜入教育局偷走试卷,结果坑了一代考生
...生了震惊全国的高考泄密案,有考生直接盗走了高考数学试卷。数学试卷被盗,全国不得已启用数学备用卷。而当初那套数学备用卷的出题老师中,有一位叫葛军的老师,人送外号“数学帝”,他出
2024-05-31 17:59:00
他偷走高考试卷,背熟考题参加考试,看到考卷让他直接傻眼
...竟然能悄无声息地潜入当地教育局,成功偷走当年的高考试卷!不难理解这名学生为何会做出如此冲动的举动,可令人不解的是,只是学生的他到底是如何偷走试卷的?试卷被偷的消息泄露后,社会
2024-04-11 12:09:00
他盗走高考试卷,通宵背题后参加考试,看到考题傻眼了
...三个密级,按照轻重依次是“秘密、机密、绝密”。高考试卷在考场上拆封以前,属于最高等级的“绝密文件”,其重要程度不亚于绝密核资料文件。然而,就在2003年6月,这个叫杨博的小伙
2024-04-26 10:51:00
首个AI高考全卷评测结果发布:最高分303,数学全不及格
...言中的一些“潜台词”,大模型尚无法完全理解。在数学试卷上,老师们发现,大模型的主观题回答相对凌乱,且过程具有迷惑性,甚至出现过程错误但得到正确答案的情况。大模型的公式记忆能力
2024-06-24 09:22:00
探访高考评卷现场:一张试卷的分数怎样“出炉”
...华网新华社北京6月15日电 题:探访高考评卷现场:一张试卷的分数怎样“出炉”新华社记者一张高考试卷从离开考场到得出分数,需要经过哪些环节?目前,各地高考评卷工作正在平稳有序进
2024-06-15 17:32:00
...各地介绍了高考评卷工作情况及高考成绩公布时间。高考试卷分数如何出炉?哪些人能参与高考评卷?各地对此作出解读。多地举行高考评卷开放日近日,多地举行高考评卷开放日活动,介绍高考评
2024-06-20 07:45:00
更多关于科技的资讯:
秦皇岛市“一品一播”直播电商活动启动
河北新闻网讯(张辉)2月8日,秦皇岛市“一品一播”直播电商暨2026年网上年货节正式启动。该活动旨在通过“一个特色产品
2026-02-09 11:21:00
“一人成军”AI实战营苏城结营 厚植创新沃土培育智能开发新锐
江南时报讯 古韵今风交融的苏州,再次成为人工智能前沿人才培养的热土。2月7日,以“一人成军”为主题的AI智能体实战训练营在苏州湾中心广场举办
2026-02-09 12:35:00
全球互连芯片“第一股”!澜起科技港交所上市!
今天(2月9日)上午9:30,铿锵锣声再次敲响了春节前“开门红”,澜起科技股份有限公司(6809.HK)成功在香港联合交易所主板挂牌上市
2026-02-09 12:38:00
降本700万!焦作为企业开出“省电良方”
大河网讯 一场“诊断”,给企业节省了约700万的用电成本。近日,国网焦作供电公司联合焦作市发改委开展“电费诊断助企惠企”专项行动
2026-02-09 13:09:00
求职新场景火爆出圈,相城区今年首场“人才夜市”吸引41家企业参与
近日,相城区首场“人才夜市”火热开市,将传统夜市的烟火气与现代招聘的精准对接巧妙融合,在轻松愉悦的氛围中搭建起企业与人才高效互动的新平台
2026-02-09 12:32:00
“云”端备年货 卢龙县举办全国网上年货节
河北新闻网讯(刘丹、徐鹏远)近日,秦皇岛市卢龙县举办了以寻味千年古韵·臻享“薯”光年礼为主题的全国网上年货节。此次活动依托多平台联动发力
2026-02-09 11:34:00
开新能源车、淘二手好物、选小份菜……绿色消费,正成为很多年轻人的新选择。在唐山一家新能源汽车店,前来选购的年轻人络绎不绝
2026-02-09 08:26:00
范围广泛覆盖范围十分广泛,囊括厦门零售、餐饮、住宿、文化艺术、娱乐、旅游、体育、居民服务业等多个民生行业,贴合市民日常消费与新春游玩的各类需求
2026-02-09 08:33:00
全市首家 夏商民兴超市东渡店完成全场景适老化改造
“银发专区”处处透着贴心——防手抖餐具、专利老人鞋垫、低糖低GI食品、专业护理垫等近百种适老化商品整齐陈列,精准匹配老年人生活需求
2026-02-09 08:33:00
银河通用具身大模型机器人在“太空舱”服务市民游客
位于中山路“太空舱”的机器人店员在销售商品。厦门网讯(文/图 厦门日报记者 林雯 通讯员 夏思萱)即将登上2026年央视春节联欢晚会的具身大模型机器人来厦门了
2026-02-09 08:34:00
厦门10人入选省首批科技创新领军人才
我市持续加大科技人才培育力度,为科技创新与产业升级提供坚实支撑。图为厦门科学城。(本报资料图)厦门网讯(厦门日报记者 李晓平 通讯员 魏云)近日
2026-02-09 08:34:00
近年来,河北银行创新运用“AI+大数据”技术,构建数字化精准治理体系,提升反洗钱、反电诈成效。河北银行通过整合行内外数据资源
2026-02-09 09:53:00
鲁网专访|市政协委员、青岛檬豆网络科技有限公司执行总裁秦军:以OPIE模式践行政协提案
鲁网2月9日讯(记者 薛同春)春潮启新程,履职正当时。青岛两会期间,任刚市长所作的政府工作报告,聚焦人工智能产业发展、新质生产力培育等核心议题
2026-02-09 10:10:00
新型研发机构如何赋能地方?看这位教授的衢州实践
在浙江贝爱达电器有限公司的生产车间,一套由电子科技大学长三角研究院(衢州)研发的智能视觉微动检测系统正稳定运行。该系统可对电力电容器瓷套管的装配状态进行实时监测与质量控制
2026-02-09 10:25:00
山东移动智慧助餐+健康守护,助力郓州道盛平社区养老服务新升级
近期,山东省菏泽市郓城县郓州街道盛平社区的养老服务悄然升级。一位老人欣喜地分享:“以前在外吃饭不懂买套餐,总是错过优惠
2026-02-09 10:44:00