• 我的订阅
  • 科技

“GPT-5”发布时间曝光!GPT-3是幼儿,GPT-4像高中生,新一代大模型将达博士水平

类别:科技 发布时间:2024-06-25 09:21:00 来源:每日经济新闻

2024年6月20日,美国达特茅斯工程学院公布了对OpenAI首席技术官米拉·穆拉蒂(Mira Murati)的采访视频。米拉在采访中透露,GPT-5将在一年半后发布,在某些领域将达到博士的智能。与此同时,Claude 3.5 Sonnet,已经成为了第一个测试分数高于最聪明的人类博士的模型。

“GPT-5”发布时间曝光!GPT-3是幼儿,GPT-4像高中生,新一代大模型将达博士水平

图片来源:截图于Youtube

近日,OpenAI CTO米拉·穆拉蒂在达特茅斯工程学院发表了关于AI在各行业中的变革潜力及其对工作的影响的重要言论。

米拉表示,大约一年半年后,OpenAI将发布“博士生水平”的人工智能。相较之下,GPT-3相当于幼儿的智能水平,GPT-4更像高中生的智能水平。但她强调,博士等级的AI仅适用于某些特定任务,“这些系统在某些特定的任务中已经达到了人类水平,当然在许多其他任务中,它们还达不到。”

“GPT-5”发布时间曝光!GPT-3是幼儿,GPT-4像高中生,新一代大模型将达博士水平

图片来源:截图于Youtube

与此同时,Anthropic于6月20日官宣发布了全新大模型 Claude 3.5 Sonnet,号称是迄今为止最智能的模型。

“GPT-5”发布时间曝光!GPT-3是幼儿,GPT-4像高中生,新一代大模型将达博士水平

图片来源:X

Claude 3.5 Sonnet不仅将AGI的倒计时推至75%,更是成为了第一个测试分数高于最聪明的人类博士分数的模型。

“GPT-5”发布时间曝光!GPT-3是幼儿,GPT-4像高中生,新一代大模型将达博士水平

图片来源:Life Architect

据Life Architect数据显示,Claude 3.5 Sonnet在研究生级推理(GPQA)、本科级知识(MMLU)和编码能力(HumanEval)上都刷新了SOTA。其中,在MMLU上,它得分90.4;在GPQA上,得分为67.2。这也是首次,LLM突破了GPQA 65%的分数,达到了最聪明的人类博士的水平。普通博士在GPQA上的得分为34%,领域内专业博士的得分为65%,而Claude 3.5 Sonnet,显然已经超越了他们。

“GPT-5”发布时间曝光!GPT-3是幼儿,GPT-4像高中生,新一代大模型将达博士水平

图片来源:Life Architect

在达特茅斯学院的采访中,主持人提出了一个假设性的问题,他问:“假设在三年后GPT变得极其智能,它是否可能自行连接到互联网并开始行动?”

对此,米拉回答说:“确实,我们对此进行了很多思考。具备AI智能体能力的系统确实存在,它们会连接到互联网,进行相互之间的交流,共同完成任务,或者与人类无缝合作。因此,我们在未来与AI的合作可能会像我们现在彼此之间的合作一样。”

“GPT-5”发布时间曝光!GPT-3是幼儿,GPT-4像高中生,新一代大模型将达博士水平

图片来源:Metaculus

人工智能的进步速度令人惊叹。

在2022年,专家们预测,人类水平的人工智能有可能在本世纪的60年代兴起,可能性为50%。然而,Metaculus预测员社区的预测时间更早,他们预测的是40年代。随着GPT-4的发布,社区的预测时间开始提前,预计在2032年,甚至最早在2027年,我们就有可能实现AGI。

“GPT-5”发布时间曝光!GPT-3是幼儿,GPT-4像高中生,新一代大模型将达博士水平

图片来源:Metaculus

6月20日凌晨,前 OpenAI 联合创始人、首席科学家伊尔亚·苏茨克(Ilya Sutskever)在社交媒体上官宣成立新公司 SSI,专注于安全超级智能。

网友称:“好家伙!这是直接越过AGI,一步迈向Super Intelligence(超级智能)了。”

“GPT-5”发布时间曝光!GPT-3是幼儿,GPT-4像高中生,新一代大模型将达博士水平

图片来源:X

伊尔亚在SSI官方账号中官宣的“开场词”里表示:“超级智能已经触手可及。构建安全超级智能(SSI)是我们这个时代最重要的技术问题。”

他还补充道:“我们将以一个焦点、一个目标、一个产品,直接追求安全的超级智能。我们将通过一个小而高效的团队所创造的革命性突破来实现它。”

“GPT-5”发布时间曝光!GPT-3是幼儿,GPT-4像高中生,新一代大模型将达博士水平

图片来源:X

总而言之,伊尔亚团队要搞的事情,用网友一个经典的表情包式的总结来看就是:

“GPT-5”发布时间曝光!GPT-3是幼儿,GPT-4像高中生,新一代大模型将达博士水平

图片来源:X

然而,人工超级智能的发展也引发了一些担忧。

近日,一篇预印本论文提出观点:随着人工超级智能(ASI)的实现,人工智能无与伦比的能力可能会让人们尊其为神,从而产生一种认知偏差,不加质疑地接受它的决定。

“GPT-5”发布时间曝光!GPT-3是幼儿,GPT-4像高中生,新一代大模型将达博士水平

图片来源:arxiv.org

作者特飞科·欧亚尔(Tevfik Uyar)警告说,这种现象可能导致我们混淆技术进步与道德伦理的优越性。“我们不能因为ASI的能力强大,就认为它在道德和伦理上也同样表现优越。”

更令人担忧的是,这种动态可能导致一种“技术官僚神权统治”,在这种统治下,决策权被移交给ASI,从而破坏了人类的主动性和批判性思维。作者强调:“如果我们将决策权交给ASI,那么人类的主动性和批判性思维可能会受到破坏。”

每日经济新闻综合公开消息

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-25 12:45:28

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

OpenAI推迟上线语音功能,GPT-5或要等到明年,大模型技术速度正在放缓
...水平,GPT-3类似婴儿水平的智能,GPT-4则进化到更像一个高中生,OpenAI接下来将致力于研究达到博士级别的智能
2024-06-26 11:35:00
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
...理科博士生水准”OpenAI曾解释过,2023年发布的GPT-4类似于高中生的智能水平,而GPT-5则是完成AI从“高中生跃升至博士”的成长
2024-09-13 13:34:00
...把书本上的物理知识很好地运用到机器人制作当中。对于高中生来说,还需要在通用技术方面不断优化创新,让机器人具有更多功能。”当天开幕式也成为本届科技体育运动会最大的看点之一。一架
2023-11-28 04:03:00
阿里吴泳铭:AGI只是起点,超级人工智能ASI才是终极目标
...已经清晰地感受到它的速度。几年时间,AI的智力从一个高中生迅速提升到博士生的水平,还能拿到国际IMO的金牌。AI Chatbot是人类有史以来用户渗透率最快的功能
2025-09-24 13:30:00
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...)。o1-mini 的得分(约 11/15 个问题)大约位于美国前 500 名高中生之列。 编码能力:在 Codeforces 竞赛网站上
2024-09-13 16:42:00
...。2023届278名高三毕业生是南平一中武夷校区招收的首届高中生,也是该校首次尝试全寄宿制管理的第一届学生。在三年的实践和探索中,学校大胆创新、优化完善深度教学教研、拔尖人才
2023-08-30 03:15:00
AI和脑科学是未来十年最有前景的领域吗?
...了心理学专业。我起初不愿意,是因为不了解,确实中国高中生接触心理学少。但进入大学后,开始了解心理学后,我就觉得非常幸运学习心理学。心理学是一个非常交叉的学科,有人文部分,如社
2023-07-13 14:00:00
他想为中国培养“菲尔兹奖”得主
...多培养出优秀数学家的国家都注重大学与高中的联系,为高中生举办寒暑校和“数学俱乐部”等活动,让他们提前接触数学研究人员,感受高等数学的魅力。然而,中国却缺乏类似的活动。于是,伊
2024-02-27 05:21:00
...人工智能大模型的平均水平相当于大学文科生,去年还是高中生水平,发展速度就这么快。在博览会上,记者见到几位高考结束正琢磨报志愿的学生。他们说,有些学长四年前报了很热门的专业,没
2024-06-23 11:11:00
更多关于科技的资讯:
大皖新闻讯 近日,上市公司黄山旅游股份发布“关于控股子公司投资建设黄山太平索道电气系统更新提升项目的公告” 。黄山太平索道位于黄山风景区内
2026-01-27 21:14:00
晋镜头 | 从“一根丝”看山西制造的进阶之路
一根长1米、仅重0.5克的“丝”,却能稳稳提起约200公斤的重物,这近乎科幻的场景,正在中国科学院山西煤化所的实验室与生产线上成为现实
2026-01-27 17:10:00
中新经纬1月27日电 (谢婧雯)“希望能重现11年前微信红包的时刻。”26日,在腾讯2026年员工大会上,腾讯董事会主席马化腾提及AI应用元宝将于春节推出的10亿元现金红包活动时说
2026-01-27 19:29:00
“之前和同事聊天计划去海南过年,当时谁也没用手机搜索。但两个小时后,我的社交平台首页就出现了海南旅游的相关推送。”近日
2026-01-27 18:06:00
给最好的创意搭配最强的算力
2026-01-27 18:23:00
鲁网1月27日讯为助力制造业高质量发展,聚焦单项冠军企业及科创型企业发展需求,2025年以来,邮储银行滨州市分行通过专项政策倾斜
2026-01-27 16:56:00
故宫同款徐州造!“清洁神器”领跑全国细分赛道
新华报业・中国江苏网讯 能守护故宫、布达拉宫等文化地标御道洁净,也能攻克城市背街小巷精细化清洁难题,这些实力与口碑兼具的“清洁神器”
2026-01-27 16:59:00
为深入贯彻中央金融工作会议精神,落实党中央提振消费的决策部署,青岛银行紧扣居民消费升级与生活品质提升需求,2025年创新推出线上数字信贷品牌“青易融”
2026-01-27 14:33:00
硬核登场,焦点汇聚 星梭科技重磅亮相2026北京国际商业航天展
1月23日至25日,2026北京国际商业航天展览会在北京亦庄隆重举行。星梭科技(北京)有限公司(展位号A260)以全新姿态重磅登场
2026-01-27 14:33:00
近日,由中国医药新闻信息协会指导、健识局主办的2025第六届论健·年度星榜发布。抗流感1类创新药——玛硒洛沙韦片(商品名
2026-01-27 14:36:00
海外网1月27日电 据美国哥伦比亚广播公司1月26日报道,谷歌公司已同意支付6800万美元(约合人民币4.73亿元),以解决一项集体诉讼案
2026-01-27 14:45:00
欧洲超级食物营养理念兴起,Myowellness超级食物受到关注
近年来,随着消费者对天然饮食与日常营养管理的重视不断提升,以植物来源为核心的超级食物(SuperFood)逐渐在欧洲市场形成稳定的消费认知
2026-01-27 15:05:00
两会快评|给最好的创意搭配最强的算力
创意是创新的源头,算力是创新的助推器。两者双向奔赴,能够催生璀璨的创新之花。综合算力指数全国第一,13个大模型通过国家备案
2026-01-27 15:20:00
打造中国版Open Evidence,蚂蚁阿福 PC端上线DeepSearch功能
今日,蚂蚁阿福升级其 PC 端,并上线DeepSearch(深度搜索)功能打造中国版“Open Evidence”,免费为医生
2026-01-27 15:47:00