• 我的订阅
  • 科技

ChatGPT更聪明了!OpenAI推出GPT-4大型语言模型:在诸多测试中表现比人类都好

类别:科技 发布时间:2023-03-15 15:00:00 来源:砍柴网

3 月 15 日消息,Open-AI 刚刚公布了其大型语言模型的最新版本 ——GPT-4(API 候补申请点此)。

GPT-4 可以更准确地解决你的难题多模态的 GPT-4 还可以生成、编辑具有创意性或技术性的文章,在高级推理方面的表现超过其前辈(当前公开版 ChatGPT 基于 GPT-3.5)。当然,正如大家所猜测的那样,微软 New Bing 的聊天功能确实基于 GPT-4。

此外,该公司正在与合作伙伴 Be My Eyes 一起测试 GPT-4 的图像输入能力(注:Be My Eyes 是一款即将推出的智能手机 App,可以识别场景并对其进行描述,类似于大家常见的 AI 识图的加强版)。

除了介绍网站,OpenAI 还提供了描述 GPT-4 功能的技术性论文,以及详细描述其局限性的系统模型 Card。

ChatGPT更聪明了!OpenAI推出GPT-4大型语言模型:在诸多测试中表现比人类都好

OpenAI 计划通过 ChatGPT 及其商业 API 为用户提供 GPT-4 的文本功能支持,但目前还需要等待。IT之家这里需要提醒一下,GPT4 目前仅 ChatGPT plus 账号可用,可选 GPT4 模式进行对话,每 4 小时限制发送 100 条消息。

收费方面,大约 750 个单词的提示收取约 3 美分的费用,约 750 个单词的响应则收取 6 美分(就是问和答的区别)。

ChatGPT更聪明了!OpenAI推出GPT-4大型语言模型:在诸多测试中表现比人类都好

据介绍,GPT-4 比以前的版本“更大”,这意味着它已经借助比前辈更多的数据进行了训练,并且在模型文件中有更多的权重,从而使得它的运行成本更高。

就任务而言,GPT-4 的表现比前辈更好,它可以遵循自然语言的复杂指令并生成技术或创意内容,而且它可以还更深入地做到这一点:它支持生成和处理多达 32768 个标记(约 25000 个文本单词),从而实现比前辈更长的内容创建或文本分析。

OpenAI 表示,GPT-4 错误答案更少,而且也会减少偏离话题的可能,也尽可能不会再谈论禁忌话题,甚至在许多标准化测试中比人类表现得都要更好一些。

例如,GPT-4 在模拟律师考试的成绩在考生中排名前 10% 左右,在 SAT 阅读考试中排名前 7% 左右,在 SAT 数学考试中排名前 11% 左右。相比之下,GPT-3.5 在律师考试中的得分一般都是倒数 10% 左右。当然,它们考个研究生还是没问题的。

ChatGPT更聪明了!OpenAI推出GPT-4大型语言模型:在诸多测试中表现比人类都好

当然,AI 毕竟是 AI,OpenAI 也表示目前 GPT-4 并不完美,它在很多场景下的能力都不如人类。

据称,该模型仍然存在“幻觉”或编造事实的问题,并且在事实方面也不一定总是可靠的,“它倾向于坚持认为它是正确的,即使它错了”。OpenAI 表示,GPT-4 正在努力解决其局限性,例如社会偏见、幻觉和对抗性提示。

【来源:IT之家】返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-03-15 16:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...,目前已经有多个人工智能系统学会了欺骗,在棋牌游戏中表现尤为明显。许多人工智能都能熟练地使用“虚张声势的策略”。对此,研究人员不无担忧地评价说,通过“习得性欺骗”,一些人工智
2024-06-08 05:35:00
智商超过99.9%人类,ChatGPT到底有多聪明?
...表示,ChatGPT十分适合作为一个被试,它不仅不会在测试中表现出应试焦虑、注意力不集中或放弃,也不会对智商测试和测试人员产生质疑
2023-04-14 12:00:00
chatgpt背后模型被证实具有人类心智
...的心智理论(TheoryofMind,ToM),已经出现在ChatGPT背后的AI模型上。”这是来自斯坦福大学的最新研究结论
2023-02-12 23:46:00
...下风,有着教育行业背景的讯飞星火大模型在一众大模型中表现抢眼,堪称“更会做题的大模型”。评测,还有很长的路要走评测作为对机器理解、处理、应用自然语言能力的一种评估和量化手段,
2024-06-26 07:26:00
微软华人团队发布全新基准AGIEval,专为人类考试而生
...的总体表现不错,但所有的语言模型都在复杂的推理任务中表现不佳,比如MATH、LSAT-AR、GK-physics和GK-Math
2023-05-13 21:28:00
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...中,GPT-4o 是闭源模型中的效果最佳的,CogVLM2 是开源模型中表现最佳的。一个很有趣的现象是加入了图片对 CogVLM2 来说有了明显的帮助(在困难模式下提升了 20
2024-06-29 09:37:00
聊天机器人目前还不理解的一件事:“否定”
...出改进建议。因此,当用户注意到 ChatGPT 在简单的否定句中表现不佳时,就会报告错误,从而使算法最终得到正确的结果
2023-06-08 14:56:00
更强更可靠!OpenAI公布GPT-4:可在考试中超过90%的人类
...的最新版本——GPT-4。该公司表示,GPT-4在许多专业测试中表现出超过绝大多数人类的水平。OpenAI于2020年发布了GPT(生成型预训练变换模型)-3(生成型预训练变换模型)
2023-03-15 23:00:00
...国科研成果网报道的《你比人工智能聪明吗?计算机语言模型在智商测试中胜过人类》。文章摘要如下:美国加利福尼亚大学洛杉矶分校的研究人员发现,在衡量智力的一系列推理测试中,自回归语
2022-12-30 15:15:00
更多关于科技的资讯:
《2025加盟投资人群洞察报告》:“80后”仍是主力、“00后”快速崛起
中新经纬1月13日电 近日,中国特许加盟展&盟享加发布《2025加盟投资人群洞察报告》,(以下简称“报告”),中新经纬研究院受权发布
2026-01-13 20:35:00
“哭哭马”凭啥“马倒成功”
一只义乌产的马年玩偶,因嘴巴被缝反了方向,从“笑笑马”变成“哭哭马”,却意外成了全网追捧的“团宠”。从网友晒图引发讨论到疯狂玩梗
2026-01-13 17:04:00
苏州工业园区创新协同机制 激发共建研发机构新活力
为进一步推动研发机构面向产业发展需求,加强产学研对接和成果转移转化,让创新资源释放最大价值,近年来,苏州工业园区科技创新委员会持续探索完善科研机构共建协同机制
2026-01-13 17:20:00
大皖新闻讯 位于灵璧经济开发区的安徽儒特智能装备股份有限公司,依托自主研发的新能源电池固态电解质研磨设备,实现研磨精度从微米级向纳米级的关键技术突破
2026-01-13 17:27:00
中国消费者报报道(记者施本允)在浙江,走进任何一家中国电信营业厅,你都能看到一个温暖的角落——“爱心翼站”。这里不仅是歇脚喝水的便民点
2026-01-13 18:15:00
济南市数据要素流通服务平台入驻数商300余家,促成数据交易2.3亿元
鲁网1月13日讯(记者 李晓晨 实习生 刘璐)1月13日,济南市政府新闻办举行济南市“高质量完成‘十四五’规划”主题系列新闻发布会——数字济南建设专场
2026-01-13 18:18:00
粒子基光谱技术的工程路径与产业化前景
技术发展的轨迹常由两种力量塑造:其一是基于现有框架的持续性创新;其二则是源于基础原理突破的范式革命。后者往往能开启全新的技术轨道与应用疆域
2026-01-13 18:42:00
2026新年限定零食礼包推荐:旺旺大礼包以 “年度独家记忆” 定义春节礼赠
艾媒咨询《2024 年中国新春礼盒消费者行为洞察报告》显示,53.74% 消费者关注限定款文化属性,36.60% 看重内容独特性
2026-01-13 18:52:00
1月12日,从太钢获悉,太钢营销数智化升级项目IMP系统近日正式上线。此举将有效提升太钢营销运营效率与核心竞争力。据介绍
2026-01-13 19:51:00
在山西焦煤西山煤电西铭选煤厂的生产车间里,503精煤输送皮带承载着乌黑发亮的煤炭奔涌向前。皮带上方,一组看似简约的智能装置静静伫立
2026-01-13 19:51:00
近日,山西省工程机械有限公司工业互联网建设取得关键进展——顺利完成工业互联网标识解析二级节点注册和主机设备全量赋码与贴码工作
2026-01-13 19:51:00
2月1日,市场监管总局和国家网信办联合制定的《网络交易平台规则监督管理办法》和《直播电商监督管理办法》将正式施行。这两部与广大消费者切身利益息息相关的新规
2026-01-13 17:44:00
索乙“哭哭马”的逆袭不可复制,但年轻人情绪消费的潜力不可忽视。如果说,生产商火速将“次品”转化为爆款,形成强大的复制生产能力所展现的市场嗅觉与“变现”能力令人欣慰
2026-01-13 14:07:00
WOOK创始人许龙华:以“拙”胜“巧” 构建中国品牌出海的高速公路
十五年前,若不是一次印度尼西亚之行,WOOK创始人许龙华或许不会注意到当地零售市场假货漫天遍地,3C零售市场两极分化的混乱状态
2026-01-13 14:37:00
泰岳天成荣获2025年度电力创新奖一等奖
日前,2025年度中国电力企业联合会电力创新奖拟授奖成果正式公示。神州泰岳旗下泰岳天成参与的《基于人工智能的输变电设备全域状态感知与辅助决策技术及应用》荣获一等奖
2026-01-13 14:37:00