• 我的订阅
  • 科技

更强更可靠!OpenAI公布GPT-4:可在考试中超过90%的人类

类别:科技 发布时间:2023-03-15 23:00:00 来源:砍柴网
更强更可靠!OpenAI公布GPT-4:可在考试中超过90%的人类

3月15日讯当地时间周二(3月14日),人工智能研究公司OpenAI公布了其大型语言模型的最新版本——GPT-4。该公司表示,GPT-4在许多专业测试中表现出超过绝大多数人类的水平。

OpenAI于2020年发布了GPT(生成型预训练变换模型)-3(生成型预训练变换模型),并将其与GPT-3.5分别用于创建Dall-E和聊天机器人ChatGPT,这两款产品极大地吸引了公众的关注,并刺激其他科技公司更积极地追求人工智能(AI)。

OpenAI周二表示,在内部评估中,相较于GPT-3.5,GPT-4产生正确回应的可能性要高出40%。而且GPT-4是多模态的,同时支持文本和图像输入功能。

OpenAI称,GPT-4比以前的版本“更大”,这意味着其已经在更多的数据上进行了训练,并且在模型文件中有更多的权重,这使得它的运行成本更高。

据OpenAI介绍,在某些情况下,GPT-4比之前的GPT-3.5版本有了巨大改进,新模型将产生更少的错误答案,更少地偏离谈话轨道,更少地谈论禁忌话题,甚至在许多标准化测试中比人类表现得更好。

例如,GPT-4在模拟律师资格考试的成绩在考生中排名前10%左右,在SAT阅读考试中排名前7%左右,在SAT数学考试中排名前11%左右。

OpenAI表示,虽然两个版本在日常对话中看起来很相似,但当任务复杂到一定程度时,差异就表现出来了,GPT-4更可靠、更有创造力,能够处理更微妙的指令。

不过,OpenAI也警告称,GPT-4还不完美,在许多情况下,它的能力不如人类。该公司表示:“GPT-4仍有许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。”

OpenAI透露,摩根士丹利正在使用GPT-4来组织数据,而电子支付公司Stripe正在测试GPT-4是否有助于打击欺诈。其他客户还包括语言学习公司Duolingo、Khan Academy和冰岛政府。

OpenAI合作伙伴微软周二表示,新版必应搜索引擎将使用GPT-4。

【来源:财联社】返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-03-15 23:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

微软华人团队发布全新基准AGIEval,专为人类考试而生
...这些评估基准实在有点小儿科了,有些任务的性能都甩了人类一截。通用人工智能(AGI)的一个重要特点是模型具有处理人类水平任务的泛化能力,而依赖于人工数据集的传统基准测试并不能准
2023-05-13 21:28:00
别考了,GPT-4分比你高
...节,主角十年如一日的练功就是为了在一场决定性的测试中超过所有竞争者,获得第一名。生活和考试中都想拿高分,无可厚非,但把生活中的种种任务当成一场场考试,每次都以答题和“拿满分”
2023-03-16 11:47:00
ChatGPT更聪明了!OpenAI推出GPT-4大型语言模型:在诸多测试中表现比人类都好
...尽可能不会再谈论禁忌话题,甚至在许多标准化测试中比人类表现得都要更好一些。例如,GPT-4 在模拟律师考试的成绩在考生中排名前 10% 左右
2023-03-15 15:00:00
...行投资,在预测准确时获取超额利润。 在量子理论预测人类经济行为方面,也有不少研究对“人类非理性决策行为可能基于量子概率”“类量子方法构建风险选择行为模型”等问题进行了探索。
2024-01-05 06:07:00
史上ai最高分,谷歌大模型创美国医师执照试题新纪录
...且在科学常识、理解、检索和推理能力等任务中,直接与人类医生水平相匹敌。在一些临床问答表现中,最高超原SOTA模型17%以上。此进展一出,瞬间引爆学界热议,不少业内人士感叹:终
2022-12-28 16:09:00
GPT-4跨过通用人工智能门槛了吗?
...人工智能(AI)确实越来越多地占据了大片土地。AI现在可在视觉、图像识别、推理、阅读理解和玩游戏等领域比人类更好地执行许多独立的认知任务。这些AI技能可能会在不到10年的时间
2023-06-02 02:15:00
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...推理问题,训练模型在响应之前花更多时间思考,类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称,该模型可以解决科学、编程和数学等更为复杂的任务
2024-09-13 16:44:00
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。奥特曼表示,虽然 o1 的表现仍然存在缺陷,不过你在第一次使用它的时候仍然会感到震撼。 其次,o1 给大模型规模
2024-09-13 16:42:00
openai公布gpt-4最新版本gpt-4模型
...该公司表示,GPT-4在许多专业测试中表现出超过绝大多数人类的水平。具体而言,GPT-4实现了以下几个方面的飞跃式提升:更聪明,做题水平越来越好;支持图像输入,拥有强大的识图
2023-03-15 23:12:00
更多关于科技的资讯: