• 我的订阅
  • 科技

逢考必过?新版ChatGPT通过美放射学委员会考试

类别:科技 发布时间:2023-05-18 11:00:00 来源:手机中国

【CNMO新闻】说起ChatGPT,想必大家并不陌生,此前许多朋友可能或多或少都被ChatGPT刷屏了,它是由OpenAI开发的一个人工智能聊天机器人程序。仅上线两个月,ChatGPT的活跃用户已经超过1亿人,火爆全球。今年3月份,OpenAI正式发布了其最新一代大型语言模型GPT-4。5月18日,CNMO注意到,加拿大科学家在近日出版的《放射学》杂志上刊登新论文称,最新版本的ChatGPT通过了美国放射学委员会的考试。

逢考必过?新版ChatGPT通过美放射学委员会考试

ChatGPT

据了解,为评估ChatGPT在美国放射学委员会考试问题上的表现并探索其优势和局限性,多伦多大学研究人员首先测试了基于GPT-3.5的ChatGPT的表现。具体来看,研究团队使用了150道选择题,这些选择题与加拿大皇家学院和美国放射学委员会考试的风格、内容和难度相当。

对此,研究人员发现,基于GPT-3.5的ChatGPT的正确率为69%,接近70%的及格线。该模型在低阶思维问题上表现相对较好,正确率为84%,但回答高级思维问题时的正确率仅为60%。

与此同时,性能更优异的GPT-4的正确率为81%,并且在高阶思维问题上的正确率为81%。不过需要注意的是,GPT-4在低阶思维问题上的正确率仅为80%,答错了12道题,而GPT-3.5全部答对了这些题目,这引发了研究团队对GPT-4收集信息的可靠性的担忧。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-05-18 14:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...志上刊登新论文称,最新版本的ChatGPT通过了美国放射学委员会的考试,突出了大型语言模型的潜力,但它也给出了一些错误答案,表明人们仍需对其提供的答案进行核查。为评估Chat
2023-05-29 05:46:00
研究显示chatgpt在会计考试中的表现远不及人类
...学运算能力。在问题类型上,ChatGPT比较擅长判断题(68.7%正确率)和选择题(59.5%正确率),但是在简答题上就很吃力(正确率在28
2023-04-25 19:40:00
一节课几百元的健身教练,拿证只需15天
...国家体能协会;ACSM:美国运动医学学会;ACE:美国运动委员会;NASM:美国国家运动医学院)在专业上的含金量较高。举重和田径等国家队、中国足球超级联赛和CBA的体能教练,
2025-07-18 07:25:00
GPT-4V医学执照考试成绩超过大部分医学生,AI加入临床还有多远?
...工智能之间的信任,让 AI 通过一个医生必须通过的资格考试或许是一个有效的方法。医学执照考试是用来评估医生专业知识和技能的标准化考试,是衡量一个医生是否有能力安全有效地护理患
2023-11-21 13:59:00
上赛季CBA联赛判罚正确率超九成 姚明:希望大家对裁判工作多提意见
...徐济成(左)、中国篮协主席姚明(中)、中国篮协裁判委员会副主任陆永明(右)出席媒体日活动。 图片来源:中国篮协人民网北京12月20日电 (记者杨磊)12月19日下午,中国篮协
2023-12-20 09:42:00
史上ai最高分,谷歌大模型创美国医师执照试题新纪录
...评估。结果显示,在科学常识方面,Med-PaLM和人类医生的正确率都达到了92%以上,而Flan-PaLM对应的数字为61
2022-12-28 16:09:00
OpenAI GPT-4 AI 模型无需额外训练可通过日本理疗师考试
...格的问题时显得有些吃力。该模型在常规问题上的表现(正确率为 80.1%)远远好于实际问题(正确率为 46.6%)。 同样
2024-09-02 09:54:00
五莲县人民医院特色科室丨影像科:设备先进技术一流
...业道德模范及先进工作者称号。现任日照市放射学专业学委员会委员,日照市中西医结合学会影像专业委员会委员。
2023-12-26 22:04:00
anthropic发布全新claude2大语言模型
...进:其在美国律师资格考试的多选题部分可以取得76.5%的正确率,前代Claude1.3为70%;在GRE阅读和写作测试中
2023-07-12 18:35:00
更多关于科技的资讯:
优秀人才薪资上不封顶!“起跑春天”杭州盛会:机器人岗位受热捧
3月14日,2026“起跑春天”杭州青年人才交流大会在杭州大会展中心举办。现场很是热闹,一边是手拿简历的青年求职者,一边是求贤若渴的单位
2026-03-14 14:58:00
AWE探展|别卷参数了!容声大冰象这台“大长腿”冰箱太圈粉
鲁网3月14日讯“这台‘大长腿’冰箱太好看了!”“冷冻30天的三文鱼竟能生食!”3月12日,伴随着AWE2026开幕,不少参展者发现
2026-03-14 15:37:00
海信璀璨650U8冰箱亮相AWE:AI真空磁场保鲜引领储鲜新趋势
鲁网3月14日讯3月12日,2026年中国家电及消费电子博览会(AWE2026)正式拉开帷幕,此前于3月5日重磅发布的世界杯定制产品——海信璀璨650U8真空头等舱冰箱
2026-03-14 15:39:00
诚信为基,科技赋能!中国太保寿险以数智化让保险更安心
鲁网3月14日讯保险业正从规模扩张加速迈向以客户需求为导向,以产品、服务、队伍质量为核心的发展新阶段。在高质量发展的转型升级进程中
2026-03-14 12:03:00
合肥又添一座“AI驱动型OPC社区”
大皖新闻讯 近日,AI“养龙虾”成为全网热点。对此,多地发文支持OpenClaw&OPC发展。OPC全称One Person Company
2026-03-14 12:20:00
高校开学第一课解锁AI正确打开方式
荆楚网(湖北日报网)讯(记者唐天琪 通讯员邵国超)“如果用财务管理的指标评估你的恋爱关系,你觉得这笔‘投资’的回报率是多少
2026-03-14 12:34:00
“三天我只睡了七八个小时,其他时间都在和‘龙虾’聊天。”这是孙艾艾见到记者后说的第一句话,作为大厂后台工程师,她从“龙虾”爆火之初就沉迷于这项技术
2026-03-14 06:51:00
想一站式淘遍全球尖货、体验未来科技、邂逅国潮新品?机会来了!以“共享大市场·出口中国”为主题的“浙里买全球·消费启杭”活动
2026-03-14 06:52:00
上班的地铁上,放眼望去,尽是抱着手机刷屏的年轻人;回到家,孩子或许正在iPad上看着动画片……我们正在进入AI数字化时代
2026-03-14 07:22:00
想体验一把“小龙虾”,结果光安装就花了四五个小时。今年1月底,当一个红色龙虾图标的AI智能体OpenClaw在硅谷极客圈开始发酵时
2026-03-14 07:22:00
三联家电章丘世茂店盛大开业:抢抓“春日经济”,助力市民“焕新家”
鲁网3月13日讯春风送暖,万象更新。在这生机盎然的春日里,三联家电章丘世茂店于3月13日盛大开业。正值“春日经济”消费热潮
2026-03-13 17:40:00
一场对话 “对”出了什么?
鲁网3月13日讯“我们依托 AI 工具实现了内容快速生产,但算力成本高、高端人才缺,政策层面有什么支持?”“有支持的,我们推出了‘算力券’政策
2026-03-13 18:14:00
新华保险河北分公司以高品质服务守护千家万户
近年来,新华保险河北分公司持续推动服务升级,以高品质服务守护千家万户。在今年3·15国际消费者权益日到来之际,新华保险河北分公司党委书记
2026-03-13 20:25:00
中新经纬3月13日电 据国家金融监管总局13日消息,近日,针对互联网助贷业务问题,金融监管总局对分期乐、奇富借条、你我贷借款
2026-03-13 21:29:00
马嘉良 河北公安警察职业学院摘要:自动驾驶技术的演进对传统静态交通管理体系提出了适应性变革要求,为保障混合交通流的安全与效率
2026-03-13 21:36:00