• 我的订阅
  • 科技

更强更可靠!OpenAI公布GPT-4:可在考试中超过90%的人类

类别:科技 发布时间:2023-03-15 23:00:00 来源:砍柴网
更强更可靠!OpenAI公布GPT-4:可在考试中超过90%的人类

3月15日讯当地时间周二(3月14日),人工智能研究公司OpenAI公布了其大型语言模型的最新版本——GPT-4。该公司表示,GPT-4在许多专业测试中表现出超过绝大多数人类的水平。

OpenAI于2020年发布了GPT(生成型预训练变换模型)-3(生成型预训练变换模型),并将其与GPT-3.5分别用于创建Dall-E和聊天机器人ChatGPT,这两款产品极大地吸引了公众的关注,并刺激其他科技公司更积极地追求人工智能(AI)。

OpenAI周二表示,在内部评估中,相较于GPT-3.5,GPT-4产生正确回应的可能性要高出40%。而且GPT-4是多模态的,同时支持文本和图像输入功能。

OpenAI称,GPT-4比以前的版本“更大”,这意味着其已经在更多的数据上进行了训练,并且在模型文件中有更多的权重,这使得它的运行成本更高。

据OpenAI介绍,在某些情况下,GPT-4比之前的GPT-3.5版本有了巨大改进,新模型将产生更少的错误答案,更少地偏离谈话轨道,更少地谈论禁忌话题,甚至在许多标准化测试中比人类表现得更好。

例如,GPT-4在模拟律师资格考试的成绩在考生中排名前10%左右,在SAT阅读考试中排名前7%左右,在SAT数学考试中排名前11%左右。

OpenAI表示,虽然两个版本在日常对话中看起来很相似,但当任务复杂到一定程度时,差异就表现出来了,GPT-4更可靠、更有创造力,能够处理更微妙的指令。

不过,OpenAI也警告称,GPT-4还不完美,在许多情况下,它的能力不如人类。该公司表示:“GPT-4仍有许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。”

OpenAI透露,摩根士丹利正在使用GPT-4来组织数据,而电子支付公司Stripe正在测试GPT-4是否有助于打击欺诈。其他客户还包括语言学习公司Duolingo、Khan Academy和冰岛政府。

OpenAI合作伙伴微软周二表示,新版必应搜索引擎将使用GPT-4。

【来源:财联社】返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-03-15 23:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

微软华人团队发布全新基准AGIEval,专为人类考试而生
...这些评估基准实在有点小儿科了,有些任务的性能都甩了人类一截。通用人工智能(AGI)的一个重要特点是模型具有处理人类水平任务的泛化能力,而依赖于人工数据集的传统基准测试并不能准
2023-05-13 21:28:00
别考了,GPT-4分比你高
...节,主角十年如一日的练功就是为了在一场决定性的测试中超过所有竞争者,获得第一名。生活和考试中都想拿高分,无可厚非,但把生活中的种种任务当成一场场考试,每次都以答题和“拿满分”
2023-03-16 11:47:00
ChatGPT更聪明了!OpenAI推出GPT-4大型语言模型:在诸多测试中表现比人类都好
...尽可能不会再谈论禁忌话题,甚至在许多标准化测试中比人类表现得都要更好一些。例如,GPT-4 在模拟律师考试的成绩在考生中排名前 10% 左右
2023-03-15 15:00:00
...行投资,在预测准确时获取超额利润。 在量子理论预测人类经济行为方面,也有不少研究对“人类非理性决策行为可能基于量子概率”“类量子方法构建风险选择行为模型”等问题进行了探索。
2024-01-05 06:07:00
史上ai最高分,谷歌大模型创美国医师执照试题新纪录
...且在科学常识、理解、检索和推理能力等任务中,直接与人类医生水平相匹敌。在一些临床问答表现中,最高超原SOTA模型17%以上。此进展一出,瞬间引爆学界热议,不少业内人士感叹:终
2022-12-28 16:09:00
GPT-4跨过通用人工智能门槛了吗?
...人工智能(AI)确实越来越多地占据了大片土地。AI现在可在视觉、图像识别、推理、阅读理解和玩游戏等领域比人类更好地执行许多独立的认知任务。这些AI技能可能会在不到10年的时间
2023-06-02 02:15:00
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。奥特曼表示,虽然 o1 的表现仍然存在缺陷,不过你在第一次使用它的时候仍然会感到震撼。 其次,o1 给大模型规模
2024-09-13 16:42:00
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...推理问题,训练模型在响应之前花更多时间思考,类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称,该模型可以解决科学、编程和数学等更为复杂的任务
2024-09-13 16:44:00
openai公布gpt-4最新版本gpt-4模型
...该公司表示,GPT-4在许多专业测试中表现出超过绝大多数人类的水平。具体而言,GPT-4实现了以下几个方面的飞跃式提升:更聪明,做题水平越来越好;支持图像输入,拥有强大的识图
2023-03-15 23:12:00
更多关于科技的资讯:
比黄金涨的还猛!羽毛球价格上涨100% 网友纷纷提前囤货
快科技4月1日消息,近两年,众所周知,黄金价格真是一路狂飙。今日上午10点25分,黄金涨至3139.92美元的新纪录高位
2025-04-01 19:09:00
本文转自:人民网人民网北京4月1日电 (记者夏晓伦)当下,消费市场的竞争日益激烈,餐饮行业也在不断探寻新的发展路径与价值增长点
2025-04-01 19:16:00
全自研高性能RISC-V服务器芯片在前海首发
本文转自:人民网睿思芯科创始人、CEO谭章熹正式发布灵羽处理器。主办方供图人民网深圳4月1日电 (刘森君)3月31日,深圳前海企业睿思芯科举办2025春季新品发布会
2025-04-01 19:35:00
比亚迪腾势赵长江:Z9GT 120km/h追尾大货车 电池完好无损没有起火自燃
快科技4月1日消息,车辆碰撞后电池起火事件频发,再次引发大家对于新能源车安全的关注。今日,腾势销售事业部总经理赵长江微博发文称
2025-04-01 19:40:00
比亚迪腾势汽车3月销量达12620辆:平均成交价36.5万元
快科技4月1日消息,2025年4月1日,腾势汽车发布最新销量数据。3月,腾势汽车累计销量达12620辆,同比增长22.8%
2025-04-01 19:40:00
SU7爆燃致3人死亡:小米汽车遭遇最严峻的信任危机
经历了一整晚的微信聊天记录发酵之后,小米SU7在安徽高速上智驾发生车祸,导致三名花季少女丧生的命案,登上了热榜的头条。巨大的舆论风波背后
2025-04-01 19:40:00
女子冒风烧纸祈福引燃9辆车 官方通报:刑拘
快科技4月1日消息,清明将至,又到了祭祖祈福的时候,尤其需要提醒大家注意用火安全。据“北京朝阳消防”最新通报,3月30日
2025-04-01 19:40:00
10年来最大改版iOS 19六月登场!3款iPhone遭淘汰无缘升级
快科技4月1日消息,苹果将于6月10日举办WWDC开发者大会,届时将公开新一代iOS 19操作系统,有消息称这将是近十年来iOS系统最大幅度的改版
2025-04-01 19:40:00
连续53年吃35000个汉堡!美国72岁奇男子创纪录:非常健康
这绝对是一个不良的示范,但美国男子唐纳德·戈斯克(DonaldGorske)是个幸运儿!他是麦叔叔家巨无霸的“终极粉丝”
2025-04-01 19:40:00
天钡新款迷你机首发4099元:锐龙7 Pro 8845HS、6个3.5寸硬盘位
快科技4月1日消息,天钡WTR MAX“NAS型迷你主机”已经上市,首发4099元。新款迷你机采用全新模具,全金属一体化构造
2025-04-01 19:40:00
中国科大实现毫秒级可集成量子存储器
大皖新闻讯 大皖新闻记者从中国科学技术大学获悉,该校郭光灿院士团队的李传锋、周宗权研究组基于团队原创的无噪声光子回波方案
2025-04-01 19:49:00
夫妻自如租房5年:妻子多项指标异常
4月1日消息,据媒体报道,一对夫妻在杭州租住自如房屋5年,妻子体检发现多项指标异常,包括胸闷、过敏性咽炎、抵抗力降低、肺部结节
2025-04-01 20:10:00
十堰广电讯(全媒体记者 张陈堰 朱江 通讯员 纪宏新)3月底,世界规模最大原址保护的恐龙蛋化石遗址青龙山恐龙蛋化石群,首次成功尝试运用三维激光扫描技术
2025-04-01 20:24:00
携手十五载 共赢新未来:新克尔光电生产基地乔迁佛山
3月29日,广东新克尔光电科技有限公司(以下简称:新克尔光电)在佛山市三水区中南高科高端电子信息港举行生产基地乔迁仪式暨年度供应商大会
2025-04-01 20:26:00
海外媒体宣发:如何用全球声音塑造品牌影响力
一、案例启示:国际品牌的破圈密码在当今全球化的市场环境下,品牌影响力的提升已成为企业在激烈竞争中脱颖而出的关键因素。海外媒体发稿作为一种高效的品牌传播方式
2025-04-01 20:52:00