• 我的订阅
  • 社会

别考了,GPT-4分比你高

类别:社会 发布时间:2023-03-16 11:47:00 来源:新周刊

别考了,GPT-4分比你高

别考了,GPT-4分比你高

图虫创意

今天凌晨,ChatGPT的制作公司OpenAI发布了多模态预训练大模型GPT-4。

新模型除了在识图能力、文字输入限制、回答准确性和文字风格变化上有了质的飞跃, 它的考试能力被着重强调了。

在GRE数学考试中,GPT-4可以考163分(170 分满分),超过80%的考生;在GRE语文(阅读与填空)考试中,GPT-4可以考169分(170分满分),超过99%的考生。

别考了,GPT-4分比你高

GPT-4在许多标准化考试中都获得了很好的分数。/网页截图

AI模仿人类的第一步,果然还是从学习如何考试开始的。

好像在人类眼里,机器人也是人,也得通过考试证明自己的能力。即便它已经超越了完成考试这个简单的用处,但我们仍在希望让它回答那些唯一的卷面答案。

就算已经工作了几年,看到对考试话题的讨论时,还总是会回忆起“被考试支配”的时刻。

在不用上考场的日子里,我们也常常会用“弯道超车”“赛道”等词语,把自己和他人都放在一个被“测试”的环境下,对生活的纪录和评分乐此不疲。

别考了,GPT-4分比你高

做乙方已经很辛苦了,但看到考试的时候还是毫不犹豫地点进去做题了。/豆瓣

或许我们真的都不喜欢考试,但我们也离不开一次次“考试”,以及随之而来的“考试思维”。

要想知道什么是考试思维,不妨来回顾一下参与一场考试所走过的“心路历程”。

学生时代,考前我们会按照参考资料和考纲背诵 标准答案,配以大量的刷题练习。

考试过程中,我们会充分发挥刷题之后形成的答题习惯,在答题卡中填入唯一解。

又或者揣摩出题人的思维,按照他们的喜好来回答,甚至不一定要认同或理解这个答案,只要拿分就好。

别考了,GPT-4分比你高

学生时代一大难题:如何揣摩出题人的意图?/@败给现实的天真

考试结束对答案的时候,如果自己的答案与班上 某个成绩好的同学答案不同,我们便会开始怀疑自己。

如果拿到了高分,就可以被“ 官方认可”成为“好学生”,而分数不高则代表仍需努力。

随分数高低而来的 排名,表现着一场永不停歇的竞争:我这次是进步还是退步了?又超过了百分之几的人?

别考了,GPT-4分比你高

成绩是衡量学生能力的最方便的标准。/《教束》剧照

需要标准答案、渴望权威认证、永远保持竞争意识,这就是考试思维的三个特征。

考试思维不仅会被运用在考场上,也作为应试教育背景下的一种群体特征和底层逻辑,运用在生活的方方面面。

比如每隔一段时间就会在社交媒体上大火的测试游戏(如星座、MBTI),总会吸引大批用户的转发,向外界展现经过“权威认证”的自我。

如果再加上分数和排名的因素,又会激起一波相互比较、竞争的热潮。

别考了,GPT-4分比你高

当时多少人为了提高自己省份的排名通宵玩《羊了个羊》。/网页截图

又比如参与话题讨论时,许多人会选择把回答与某个“主义”或名人名句联系在一起,似乎 把自己的回答套入一个有标准答案的框架中,就能在“发表观点”这道题中拿到满分。

而爱好者众多的武侠、仙侠小说中,也总有诸如“武林大会”“灵力测试”这种酷似高考的情节,主角十年如一日的练功就是为了在一场决定性的测试中超过所有竞争者,获得第一名。

生活和考试中都想拿高分,无可厚非,但把生活中的种种任务当成一场场考试,每次都以答题和“拿满分”的心态去面对,未必一定奏效。

职场新人 肉肉觉得自己就是一个被考试思维牢牢绑定的人。

从小到大她都很会考试,就读的每所学校都是名校。她特别 擅长揣摩出题人的心思:“我会去看历年的真题里反复出现的知识点,只抓重点去背记。”

别考了,GPT-4分比你高

对肉肉来说,考试不是什么难事。/图虫创意

因为成绩好,肉肉经常作为班级代表、学生代表发言,她也习惯了被老师和校领导交口称赞。

但同时,只要她的成绩排名有一点点波动,就会受到老师的加倍关注,所以她也会时刻关注自己和他人的排名变化。

进入职场后,肉肉突然发现自己不再是那个“轻易拿高分”的人了, 考试思维的弊端在职场新人身上体现得尤为明显。

习惯了以前有标准答案和考纲的答题方式,肉肉在开始一项工作前也总希望有人能对自己进行指导,为此没少被批评“缺乏主动性”。

别考了,GPT-4分比你高

只会考试,无法解决所有问题。/《天空之城》剧照

作为创意策划,肉肉发挥了学生时代“揣摩出题人思路”的方式来做策划案,尽可能推测领导喜欢的方向,但收效甚微。

对权威认证的关注也很难改变,组会头脑风暴的时候,她总因为自己是新人不敢说话。好不容易发了言,如果领导没有明确表示认可,肉肉就会万分失落。

执行过程中肉肉又 本能地害怕拿不到领导认可的“高分”,因此奉行一贯的完美主义,方案改了又改就是不敢交,反而拖了很多项目时间。

习惯了学生时代以笔芯数量、卷子厚度作为努力的计量单位,到了没有标准测试目标的时候,肉肉还会给自己创造一些测试。

别考了,GPT-4分比你高

喜欢用考试解决问题的人,或许只是不想当差生。/豆瓣

她会将某个和自己情况相近的同事所达到的“成就”树立为自己的目标,然后去努力达成。达成一个之后再转向下一个,竞争和比较永不停止。

“有时也会觉得自己是个‘学人精’,但其实我也很难控制自己——我好像 被困在一张看不见的考卷中,只是不想考得落后于人而已。”肉肉表示。

不难发现,考试思维其实是学生时代沿用而来的一种 惯性思维。

在应试教育模式里得心应手、擅长考试的人,往往习惯了考试带来的“付出就会有回报”的模式,也习惯于这种可控制感带来的成就感。

若他们遇到“付出而又没有回报”的事情的时候,会产生很强的挫败感,特别希望通过考试这个自己熟悉且有自信的方式来解决问题。

别考了,GPT-4分比你高

读书时坚信着努力就会有回报,但现实情况要比这复杂得多。/上野千鹤子东京大学开学典礼致辞

与此同时,考试思维的背后隐藏着一种深深的不安,它的本质是 不自信的。

在应试教育“千军万马过独木桥”的竞争之中,似乎只有得到了高分、受到了权威的认可才是对的,其余的尝试都不被鼓励。

为此“考生”们不得不奉行着考试思维,时刻想着如何竞争、如何提升自己的排名。

中国政法大学教授罗翔在谈到考试时曾说,任何的标准化考试,只要多做真题,基本都能通过。

别考了,GPT-4分比你高

与此相对的是非标准化考试,如赛跑,只要能赢就行。/网页截图

这是因为这类考试有相对统一的标准,因此也有“应试技巧”可循,只要学生掌握了答题技巧就能成功拿到好成绩、被认可。

诚然,熟练运用考试思维或许可以帮助自己在某些事情上获得“高分”,但实际上还是在他人的标准下“戴着镣铐跳舞”,始终受制于人。

而走出考场后的生活已经没有了标准化的答案,我们更需要放弃对考试带来的可控制性、可预测性的依赖,用更加灵活和创新的方式来面对新的考验。

毕竟生活不是标准化考试,不用每次都拿到高分,只要最终的结果令自己满意就好了。

别考了,GPT-4分比你高

《青春派》

当我们开始正视考试思维的时候,或许就是我们开始摆脱它的影响的时候。

GPT-4让我们看到,人类能向它提出什么问题,AI就能走多远。考试思维能将我们训练成一个好的答题人,但未来我们或许更需要做那个出题的人。

撰稿 牧羊

编辑 西西

校对 赖晓妮

排版 张颖娴

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-03-16 12:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...后,学习负担较重,而课堂教学往往以“给出标准答案、考试得到高分”为目标,学生思考和表达的空间较小,创新思维得不到充分激发。新高考改革明确提出要考查学生的创新思维,引导学生从“
2023-03-14 08:25:00
...喜欢写作文吗?我估计直接回答“喜欢”的人还是少数。考试作文跟平时写篇随笔不一样。有一次上课的时候,我从窗户里打眼看见校园里的栾树变了颜色,于是即兴就给学生布置了一篇随笔题目《
2023-08-28 00:08:00
鲁网6月6日讯(记者 王玉龙)又是一年考试季,千万学子即将步入中高考的考场。教室里,沙沙的写字声将决定许多人未来数年的教育轨迹;校门外,焦虑的家长翘首以盼,仿佛这一纸试卷承载着孩
2025-06-06 16:26:00
树立整体思维进行强化训练
...化学树立整体思维进行强化训练彪银鹏 纵观近几年化学考试,有一个奇怪的现象:一方面,考题不偏、不怪、不超纲,且命题风格基本保持稳定,没有出现大起大落的变化;另一方面,学生纷纷叫
2024-05-06 09:34:00
...价体系是如何通过高考真题得以落地的。四是教育部教育考试院发布的高考各学科试卷评析文章。每年高考结束后,教育部教育考试院都会在相关权威媒体(如《中国教育报》、《中国考试》杂志)
2023-09-22 11:11:00
...地理是门玄学”,指的是成绩一会儿高,一会儿低,似乎考试成了“看运气”的事儿。真的是这样吗?“地理绝对不是玄学!”何老师说,根据知识点的内容和类型不同,都有相应的解决方法。有些
2025-03-07 07:27:00
...一个查漏补缺、不断发现问题和错误的过程。在各种模拟考试和检测中,必然会出现很多做错的题。如何对待错题成为很多教师和学生在高考复习过程中的最大困惑之一。本人结合从事化学教学的经
2024-03-01 09:03:00
...□ 本报记者 赵丽□ 本报见习记者 丁一“帮公共选修课考试,包满绩(绩点,多所高校对学生评价的方式),时间地点价格私聊”“帮忙找题目,有意者私聊”……近日,来自重庆某高校的大
2024-01-02 01:46:00
加强思维考查 强化素质导向
...中国教育报加强思维考查 强化素质导向——教育部教育考试院命题专家评析二〇二四年高考数学试题扫码查看相关报道6月7日下午,2024年高考数学开考。今年,教育部教育考试院命制了全
2024-06-08 09:37:00
更多关于社会的资讯:
社区回应街头多人“爬行学狗叫”:涉事公司承诺后续不会用这种方式开展团建活动
大皖新闻讯 10月16日,广东惠州市惠阳区开城大道附近,多人在地上爬行学狗叫的视频在网上传播,引发关注。10月17日下午
2025-10-17 18:53:00
九旬老人腰椎骨折获新生 家属赠锦旗赞仁心仁术
鲁网10月17日讯日前,荣成市人民医院骨一科病房内上演了温馨一幕:92岁的王奶奶及家属将鲜花和一面绣有“医德高尚 医术精湛
2025-10-17 16:12:00
60余次团圆的背后:祝清儒以无人机为援,让失联不再成遗憾
齐鲁晚报•齐鲁壹点 李潇“别人曾伸手帮过我,我就该把这份暖传递下去。”面对全网对“夜寻老人”视频的刷屏点赞,菏泽单县青年志愿者祝清儒的回应朴实无华
2025-10-17 14:00:00
损失难以统计!居民藏于铁盒的现金被老鼠咬成碎片,已无法兑换
大皖新闻讯 日前,有安徽亳州的网民发视频称,家中老人将现金和存折放在楼上,不料被一窝老鼠咬成碎片,引发关注。10月17日
2025-10-17 13:03:00
泰山港华燃气开展燃气壁挂炉“以旧换新”专项行动将安全与温暖送上门
随着冬季采暖期临近,燃气壁挂炉使用安全成为居民关注的焦点。为切实解决广大燃气用户“专业换新渠道少、费用成本顾虑多”等痛点问题
2025-10-17 12:51:00
辽宁朝阳警方通报:失踪4岁女童已被找到,生命体征平稳
中国网10月17日讯 辽宁朝阳市公安局10月17日发布警情通报:2025年10月15日14时16分许,朝阳市建平县公安局接到报警求助:一名4岁女童在建平县黑水镇大营子村山地附近走失
2025-10-17 12:43:00
32.5万吨甲醇双燃料矿砂船项目首制船开工建造
9月29日,32.5万吨甲醇双燃料矿砂船项目首制船开工仪式在北海造船举行,标志着项目船舶正式进入实质建造阶段。巴西淡水河谷
2025-10-17 10:33:00
2024年12月16日凌晨2时左右,位于西安市丈八北路南风日化厂西门内的一家汽车维修公司突然失火,火势迅速蔓延,将毗邻的陕西国台帝泊洱商贸有限公司(以下简称国台公司)仓库存酒过火烧毁
2025-10-17 08:00:00
“我家去年申请停热并交了基本热费,今年想继续申请却被热力公司要求补缴去年的70%热费,而且还要交违约金,原因说是我家供热阀门未关
2025-10-17 07:58:00
让数据多跑路,群众不跑腿邯郸在全省率先实现高龄津贴“免申即享”全覆盖河北日报讯(记者刘剑英)“不用准备任何资料,也不用填表
2025-10-17 07:45:00
中新经纬10月16日电 据“萝卜快跑法务部”微信号16日消息,萝卜快跑16日发布声明称,不法分子冒用“萝卜快跑”名义实施违法犯罪行为
2025-10-16 17:11:00
【北大名医在青岛】罕见左足“核心枢纽”距下关节脱位骨折,北大人民青岛医院骨科“院士团队”微创手术精准复位
鲁网10月16日讯近日,北京大学人民医院青岛医院创伤(骨科)中心在北京大学人民医院创伤骨科“院士团队”专家张培训教授的带领下
2025-10-16 17:22:00
曾陷“输血困境”,今跨千里重生!——省外血液病患者赴烟台毓璜顶医院接受移植手术
鲁网10月16日讯(记者 魏萱 通讯员 李成修 李添祎)近日,烟台毓璜顶医院干细胞移植病房内,呈现出一幕温情满满的画面
2025-10-16 17:22:00
如何正确面对和疏导儿童青少年躯体化反应
鲁网10月16日讯(记者 魏萱 通讯员 李成修 马瑾 李凌峰)在儿科临床诊疗中,儿童青少年的“怪病”并不少见——没有明确病因
2025-10-16 17:24:00