• 我的订阅
  • 科技

逢考必过?新版ChatGPT通过美放射学委员会考试

类别:科技 发布时间:2023-05-18 11:00:00 来源:手机中国

【CNMO新闻】说起ChatGPT,想必大家并不陌生,此前许多朋友可能或多或少都被ChatGPT刷屏了,它是由OpenAI开发的一个人工智能聊天机器人程序。仅上线两个月,ChatGPT的活跃用户已经超过1亿人,火爆全球。今年3月份,OpenAI正式发布了其最新一代大型语言模型GPT-4。5月18日,CNMO注意到,加拿大科学家在近日出版的《放射学》杂志上刊登新论文称,最新版本的ChatGPT通过了美国放射学委员会的考试。

逢考必过?新版ChatGPT通过美放射学委员会考试

ChatGPT

据了解,为评估ChatGPT在美国放射学委员会考试问题上的表现并探索其优势和局限性,多伦多大学研究人员首先测试了基于GPT-3.5的ChatGPT的表现。具体来看,研究团队使用了150道选择题,这些选择题与加拿大皇家学院和美国放射学委员会考试的风格、内容和难度相当。

对此,研究人员发现,基于GPT-3.5的ChatGPT的正确率为69%,接近70%的及格线。该模型在低阶思维问题上表现相对较好,正确率为84%,但回答高级思维问题时的正确率仅为60%。

与此同时,性能更优异的GPT-4的正确率为81%,并且在高阶思维问题上的正确率为81%。不过需要注意的是,GPT-4在低阶思维问题上的正确率仅为80%,答错了12道题,而GPT-3.5全部答对了这些题目,这引发了研究团队对GPT-4收集信息的可靠性的担忧。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-05-18 14:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...志上刊登新论文称,最新版本的ChatGPT通过了美国放射学委员会的考试,突出了大型语言模型的潜力,但它也给出了一些错误答案,表明人们仍需对其提供的答案进行核查。为评估Chat
2023-05-29 05:46:00
研究显示chatgpt在会计考试中的表现远不及人类
...学运算能力。在问题类型上,ChatGPT比较擅长判断题(68.7%正确率)和选择题(59.5%正确率),但是在简答题上就很吃力(正确率在28
2023-04-25 19:40:00
一节课几百元的健身教练,拿证只需15天
...国家体能协会;ACSM:美国运动医学学会;ACE:美国运动委员会;NASM:美国国家运动医学院)在专业上的含金量较高。举重和田径等国家队、中国足球超级联赛和CBA的体能教练,
2025-07-18 07:25:00
GPT-4V医学执照考试成绩超过大部分医学生,AI加入临床还有多远?
...工智能之间的信任,让 AI 通过一个医生必须通过的资格考试或许是一个有效的方法。医学执照考试是用来评估医生专业知识和技能的标准化考试,是衡量一个医生是否有能力安全有效地护理患
2023-11-21 13:59:00
上赛季CBA联赛判罚正确率超九成 姚明:希望大家对裁判工作多提意见
...徐济成(左)、中国篮协主席姚明(中)、中国篮协裁判委员会副主任陆永明(右)出席媒体日活动。 图片来源:中国篮协人民网北京12月20日电 (记者杨磊)12月19日下午,中国篮协
2023-12-20 09:42:00
史上ai最高分,谷歌大模型创美国医师执照试题新纪录
...评估。结果显示,在科学常识方面,Med-PaLM和人类医生的正确率都达到了92%以上,而Flan-PaLM对应的数字为61
2022-12-28 16:09:00
OpenAI GPT-4 AI 模型无需额外训练可通过日本理疗师考试
...格的问题时显得有些吃力。该模型在常规问题上的表现(正确率为 80.1%)远远好于实际问题(正确率为 46.6%)。 同样
2024-09-02 09:54:00
五莲县人民医院特色科室丨影像科:设备先进技术一流
...业道德模范及先进工作者称号。现任日照市放射学专业学委员会委员,日照市中西医结合学会影像专业委员会委员。
2023-12-26 22:04:00
anthropic发布全新claude2大语言模型
...进:其在美国律师资格考试的多选题部分可以取得76.5%的正确率,前代Claude1.3为70%;在GRE阅读和写作测试中
2023-07-12 18:35:00
更多关于科技的资讯:
电商物流共享给南和宠物食品带来什么——河北特色产业集群共享智造故事(九)漫步邢台市南和区,宠物元素扮靓了街头巷尾。一家家宠物食品公司车间厂区里
2025-12-28 07:44:00
12月26日,位于杭州云栖小镇的国家机器人检测与评定中心(总部)浙江检测中心(以下简称“浙江检测中心”)正式启用。机器人从样机走向量产
2025-12-27 08:10:00
喜报|米糠云顺利通过双ISO体系认证,安全与品质再上新台阶
近日,深圳市米糠云科技有限公司顺利通过ISO27001信息安全管理体系认证与ISO9001质量管理体系认证。这标志着公司在信息安全管理和质量管理方面达到了国际标准
2025-12-27 14:34:00
退货仓分拣 “堵点” 怎么破?快宝共配给出答案
近年来,电商与直播电商的迅猛发展,不仅催生出庞大的正向物流需求,更让逆向物流成为快递行业名副其实的“蓝海”。消费者退换货需求呈爆炸式增长
2025-12-27 14:36:00
京东跨年盛典开启 送好礼官方直降五折起 还能抽祝福“大排面”
岁末迎新,跨年不只是一种仪式,更是一场表达与传递的情感盛宴。京东今年再度打造“年度宠粉”跨年盛典,不仅有众多官方直降5折起的尖货好物
2025-12-27 14:36:00
专为X3D处理器打造,技嘉X870E X3D系列主板全面上线
2025年最热门的CPU毫无疑问当属AMD锐龙X3D系列,而技嘉作为AMD核心合作伙伴之一,专为AMD X3D系列处理器量身定制了X870E X3D系列主板
2025-12-27 14:37:00
58同城2025中国好雇主盛典在深举行,勾勒数智时代雇主价值新坐标
12月26日,58同城2025“中国好雇主”盛典在深圳举办。作为国内极具影响力的雇主品牌盛会,本届盛典以“数智驱动,百业共生”为核心主题
2025-12-27 14:38:00
从“终于有了”到“真的好用”:“山大v卡通”鸿蒙版如何回应期待,定义智慧校园新体验
鲁网12月27日讯“终于有NFC校园卡了,自己的学校必须给个好评!”“NFC终于上了!” 在华为应用商店的评论区,山东大学师生们的真实留言
2025-12-27 17:30:00
想在短视频的蓝海遨游?别错过这部“实战指南”
都说“万物皆可短视频”,哪些内容让你眼前一亮?电筒拍大片、夜空光魔法、特效变装秀、用烘焙复刻文物、把大好河山“穿”在身上……在这个创意无限的世界里
2025-12-27 19:55:00
“新”中有数|福建首张文旅研学领域数据产权登记证书落地福州
福州新闻网12月27日讯(记者 颜澜萍)近日,福州冶城集团所属企业福建百宝图科技有限公司通过福建省大数据集团旗下福建省数据产权登记平台
2025-12-27 21:00:00
12月26日,杭州市市场监督管理局召开专题新闻通气会,对外公布了2025年不锈钢真空杯与儿童旅游鞋两类产品的质量比对结果
2025-12-27 07:39:00
昨天下午,2025“梦溪杯”宋韵文化创新大赛颁奖典礼在杭州凤凰里文创园举行。自10月15日启动至11月20日截稿,大赛共收到来自英国
2025-12-27 07:39:00
杭州市西湖区后陡门58号,原本只是城市边缘一个普通的小村子,仅仅三年,这里已经蜕变成“种地星”人的共同家园。这个开园仅两个多月的农文旅融合空间
2025-12-27 07:39:00
装有红酒的纸箱从1米多的高度多次抛下,又被送入抗压测试机内,接受300公斤的压力测试,再经斜面冲击台俯冲撞向铁板,红酒依然完好无损……经过这一系列流程
2025-12-27 07:39:00
近日,智联招聘发布的《2025雇佣关系趋势报告》显示,78.2%的职场人每周至少使用一次AI工具开展工作。该《报告》基于大量调研问卷生成
2025-12-27 07:39:00