• 我的订阅
  • 科技

用AI来做全国高考试卷,真的有人试了!结果:成绩偏科很严重

类别:科技 发布时间:2024-06-26 22:29:00 来源:卓越科技

最近两年,ChatGPT的火热催生了一大批AI大模型,让大家对于生成式AI的能力,可谓是又惊讶又担心,引发大家的担忧,担心自己的工作、技能会被AI取代!

而高考这样的知识性的测验,就很适合AI大模型去做测试,如果用AI来代替学生去高考,会怎么样?

用AI来做全国高考试卷,真的有人试了!结果:成绩偏科很严重

欸,还真的有人试了。

上海人工智能实验室近日公布了司南评测体系OpenCompass选取开源大模型测试今年高考的全国新课标I卷“语数外”的结果,为了确保“闭卷”考试,大模型的开源时间早于高考,同时邀请有高考评卷经验的教师人工批卷。

选取的大模型分别是OpenAI的GPT-4o、法国的Mixtral8x22B、零一万物的Yi-1.5-34B、智谱AI的GLM-4-9B、上海人工智能实验室的InternLM2-20B-WQX以及阿里巴巴的Qwen2-57B和Qwen2-72B。

用AI来做全国高考试卷,真的有人试了!结果:成绩偏科很严重

结果成绩最好的是阿里巴巴Qwen2-72B大模型,满分420分的情况下,总分达到了303分;排在第二名的是GPT-4o,获得296总分;排在第三位的InternLM2-20B-WQX,总分在295.5分,成绩还算不错。

但是7款大模型有一个共通问题,就是偏科严重!

语文、英语此类的语言类型的测试,成绩相对都要好一点,语文平均得分率为67%,英语更是达到了81%。而数学偏向于计算、公式计算的测试,7款大模型的测试成绩都比较差,甚至最低的仅有21分,最高的也仅有75分,虽然记住了公式,但是不能灵活应用。

用AI来做全国高考试卷,真的有人试了!结果:成绩偏科很严重

显然,现阶段来说大模型还待提升的空间,对于这样的测试结果,大家还满意吗?

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-27 09:45:31

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...。如果让大模型和国内学子同台竞技,做同一套高考真题试卷,结果会是怎样?大模型考上文科本科,豆包获国内头筹在极客公园最新发布的高考新课标Ⅰ卷大模型评测报告中,GPT-4o以56
2024-06-26 11:14:00
...”。首先,LLMEVAL团队选取了2024年高考新I卷、新II卷数学试卷的客观题(单选、多选和填空题,共73分)来评测,得出了不同的结论。使用客观题测试大模型的好处是,对就是
2024-06-26 07:26:00
名师点评河南高考物理丨整体难度适中 对计算能力有一定要求
...合性相结合,充分体现了新课标和核心素养的要求。一、试卷整体分析物理试卷共100分,其中力学6道,电磁学6道,光学1道,热学1道,近代物理1道,考点分布非常合理。分数上力学39
2025-06-08 19:13:00
高考泄密案:考生潜入教育局偷走试卷,结果坑了一代考生
...生了震惊全国的高考泄密案,有考生直接盗走了高考数学试卷。数学试卷被盗,全国不得已启用数学备用卷。而当初那套数学备用卷的出题老师中,有一位叫葛军的老师,人送外号“数学帝”,他出
2024-05-31 17:59:00
他偷走高考试卷,背熟考题参加考试,看到考卷让他直接傻眼
...竟然能悄无声息地潜入当地教育局,成功偷走当年的高考试卷!不难理解这名学生为何会做出如此冲动的举动,可令人不解的是,只是学生的他到底是如何偷走试卷的?试卷被偷的消息泄露后,社会
2024-04-11 12:09:00
他盗走高考试卷,通宵背题后参加考试,看到考题傻眼了
...三个密级,按照轻重依次是“秘密、机密、绝密”。高考试卷在考场上拆封以前,属于最高等级的“绝密文件”,其重要程度不亚于绝密核资料文件。然而,就在2003年6月,这个叫杨博的小伙
2024-04-26 10:51:00
首个AI高考全卷评测结果发布:最高分303,数学全不及格
...言中的一些“潜台词”,大模型尚无法完全理解。在数学试卷上,老师们发现,大模型的主观题回答相对凌乱,且过程具有迷惑性,甚至出现过程错误但得到正确答案的情况。大模型的公式记忆能力
2024-06-24 09:22:00
探访高考评卷现场:一张试卷的分数怎样“出炉”
...华网新华社北京6月15日电 题:探访高考评卷现场:一张试卷的分数怎样“出炉”新华社记者一张高考试卷从离开考场到得出分数,需要经过哪些环节?目前,各地高考评卷工作正在平稳有序进
2024-06-15 17:32:00
...各地介绍了高考评卷工作情况及高考成绩公布时间。高考试卷分数如何出炉?哪些人能参与高考评卷?各地对此作出解读。多地举行高考评卷开放日近日,多地举行高考评卷开放日活动,介绍高考评
2024-06-20 07:45:00
更多关于科技的资讯:
杭州小锣号网络科技:在GEO营销领域的深度探索与产业革新
在人工智能‌深度渗透生活‌的今天,数字营销正经历着从“广泛覆盖”到“精准触达”的深刻变革。杭州小锣号网络科技有限公司,作为一家坚持自主创新理念的综合数字营销服务商
2026-02-03 20:57:00
智能非智慧乐符在心↑↑点击上方视频↑↑看肖白谈AI与音乐创作2026年,人工智能技术持续渗透各行各业,音乐领域亦迎来新的思考与挑战
2026-02-03 21:09:00
今天(3日),工业和信息化部等八部门联合发布了《汽车数据出境安全指引(2026版)》(以下简称《安全指引》),这一《安全指引》的发布
2026-02-03 21:41:00
仁怀:以码立质 以价惠民 产区金字招牌持续擦亮
多彩贵州网讯作为中国酱香白酒核心产区,近年来,贵州仁怀通过认证赋码、发布亲民酒等创新举措,由政府与行业协会双重背书,帮助优质产品在市场中脱颖而出
2026-02-03 22:31:00
新春走基层|“AI”上春运,让回家的路更“懂”你
春运,这场承载亿万家庭团圆期盼的“流动史诗”,在2026年的寒冬里因AI技术的深度浸润而暖意倍增。当智能客服毫秒级响应旅途困惑
2026-02-03 16:53:00
鲁网2月3日讯2月3日,济南市槐荫区第十九届人民代表大会第五次会议开幕,槐荫区区长刘敬涛代表区政府作政府工作报告。报告提到
2026-02-03 17:28:00
八部门联合发文 推进汽车数据高效便利安全跨境流动
中国网2月3日讯 据“工信微报”微信公众号消息,为贯彻落实党中央、国务院决策部署,推动建立高效便利安全的汽车数据跨境流动机制
2026-02-03 18:27:00
近日,在上海临港新片区一栋现代化研发楼里,没有黑板与讲台,却有真实的测试机台、高速示波器和正在运行仿真的EDA软件界面
2026-02-03 18:18:00
1月29日下午,“数智赋能 全链护航”吴江区企业全周期服务赋能大会在苏州东太湖大厦举行。吴江区40余家企业和商协会代表参会
2026-02-03 14:42:00
鲁网2月3日讯1月30日晚间,苏宁易购发布2025年度业绩预告。公告显示,公司预计全年实现归属于上市公司股东的净利润5000万元至7500万元
2026-02-03 15:10:00
初瑞雪年货节首秀告捷,辛选合伙人制激发主播新活力
鲁网2月3日讯春节临近,市场的消费热情也逐渐高涨。2月1日,辛选集团董事长、快手头部主播初瑞雪首度开启辛选超级年货节,为用户打造了一场绚丽多彩的春节“线上集市”
2026-02-03 15:42:00
中国消费者报武汉讯(记者吴采平)2月2日,记者从湖北省消费者委员会了解到,2025年,湖北各级消协组织共受理消费者投诉73567件
2026-02-03 15:00:00
中国消费者报报道(记者李燕京)如今,随着健康类可穿戴设备市场规模持续扩大,消费需求也告别了尝鲜猎奇的初级阶段,全面转向健康实用的核心诉求
2026-02-03 15:00:00
鲁网2月3日讯面对自助设备服务投诉这一长期困扰客户体验与银行声誉的痛点,建行临沂分行深入贯彻落实总行关于运营服务提质增效的要求
2026-02-03 11:06:00
新春走基层|从南到北,这群技术牛人为何选择捷翼科技?
在外企拥有稳定职位、优渥待遇的技术专家周同昌,在2025年底,做了一个令许多人意外的决定:放弃原有的“舒适区”,加入长春捷翼汽车科技股份有限公司
2026-02-03 11:31:00