• 我的订阅
  • 科技

openaigpt-4o登顶竞技场排行榜

类别:科技 发布时间:2024-05-15 13:37:00 来源:浅语科技

5月14日消息,OpenAI员工WilliamFedus周一在社交平台X证实,近期在LMSYS聊天机器人竞技场(ChatbotArena)上表现优异的神秘聊天机器人“gpt-chatbot”,正是他们刚刚发布的全新人工智能模型GPT-4o。Fedus还透露,GPT-4o在测试中登顶了竞技场排行榜,取得了有史以来的最高分。

openaigpt-4o登顶竞技场排行榜

“GPT-4o是我们最先进的尖端模型,”Fedus在推特上写道,“我们一直在竞技场使用‘im-also-a-good-gpt2-chatbot’的名称测试该模型的一个版本。”

openaigpt-4o登顶竞技场排行榜

聊天机器人竞技场是一个网站,访客可以同时与两个随机的AI语言模型对话,却不知道哪个是哪个,然后选择提供更好回复的模型。

从今年4月份开始,OpenAI在竞技场测试了多个版本的GPT-4o,该模型最初以“gpt2-chatbot”的名称出现,然后变成了“im-a-good-gpt2-chatbot”,最后是“im-also-a-good-gpt2-chatbot”。

自GPT-4o今日发布以来,多方消息人士透露,该模型以巨大优势登顶了LMSYS的内部排行榜,超越了之前排名最高的模型Claude3Opus和GPT-4Turbo。

lmsys.org的官方账号分享了一张图表,并写道:“‘gpt2-chatbot’系列模型刚刚飙升至榜首,以显著的优势(约50Elo)超越了所有其他模型,它已经成为竞技场中最强大的模型。这是一张内部截图,公开版本的‘gpt-4o’现已进入竞技场,并很快将出现在公开排行榜上!”

openaigpt-4o登顶竞技场排行榜

截至IT之家发稿时,“im-also-a-good-gpt2-chatbot”的Elo分数为1309,领先于GPT-4-Turbo-2023-04-09的1253分和Claude3Opus的1246分。在三个“gpt2-chatbot”出现并搅局之前,Claude3和GPT-4Turbo一直在排行榜上争夺冠军。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-15 19:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

起猛了,GPT-4o被谷歌新模型击败,ChatGPT官号:大家深吸一口气
...2000人匿名投票,Gemini 1.5 Pro(0801)代表谷歌首次夺得lmsys竞技场第一。(中文任务也第一)而且这次还是双冠王
2024-08-05 09:36:00
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
【新智元导读】以开源极客之姿杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B
2024-11-20 09:43:00
腾讯混元首次上榜Chatbot Arena排名:跻身全球Top 15
...,腾讯官方发文宣布,腾讯混元首次上榜海外权威大模型竞技场 Chatbot Arena最新排名,跻身全球 Top 15
2025-03-20 00:27:00
逆水寒“ai竞技场”将于11月22日正式上线
...日,国风MMO手游逆水寒宣布将在其2.2.2新版本中上线“AI竞技场”功能,这一创新举措旨在通过游戏平台,汇聚广大玩家力量,对当下热门的AI大模型进行客观评估。据悉,逆水寒“
2024-11-21 10:46:00
《哎呀好身材·奔赴季》定档,百位体能强者上演力量美与运动美
...呀好身材·奔赴季》也重启了观察室环节,“真人秀+棚内竞技场+观察室的”全新模式让节目增添了许多亮点。通过能量助力官们的沉浸式观察和深度体验,观众能更直观地感受到竞技体育的魅力
2023-10-04 11:04:00
国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10
...式对外发布新旗舰模型——Yi-Lightning(闪电)。在大模型竞技场(Chatbot Arena)上,Yi-Lightning性能直冲总榜单并列第6
2024-10-17 09:48:00
GPT-4o mini登顶大模型竞技场,奥特曼:两个月内微调免费
...刚,GPT-4o mini版迎来“高光时刻”——登顶了lmsys大模型竞技场,和满血版并列第一,还把Claude 3
2024-07-25 09:31:00
GPT-4omini为啥登顶竞技场?OpenAI刷分秘诀被扒,奥特曼早有暗示
为啥GPT-4o mini能登顶大模型竞技场??原来是OpenAI会刷分呀。这两天,lmsys竞技场公布了一份充满争议的榜单
2024-07-30 09:30:00
...海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena,首度集齐国内主流大模型全阵容,阿里通义千问、百度文心一言、腾讯混元、字节跳动豆包、书生·浦
2024-06-02 05:34:00
更多关于科技的资讯:
厦门网讯(厦门日报记者 林露虹 通讯员 管轩 雷飏)集护眼、通透、高刷新率于一体的天马 “天工屏”;“全球最窄四等边设计”的手机屏幕……今年以来
2025-10-10 08:28:00
2025河北国际工业设计周活动观察:全球智慧赋能未来智造
全球智慧赋能未来智造——2025河北国际工业设计周活动观察9月20日,2025河北国际工业设计周主会场活动在雄安新区举行
2025-10-10 08:40:00
工信部日前公布首批制造业数字化转型促进中心建设主体名单,太原福莱瑞达物流设备科技有限公司入选。制造业数字化转型促进中心是国家落实产业数字化战略的核心公共服务载体
2025-10-10 08:42:00
10月9日,从太原第二热电厂获悉,为全力保障太原市冬季供热安全稳定,持续提升供热服务质效,太原二热秉持“早谋划、早部署
2025-10-10 08:43:00
齐鲁晚报·齐鲁壹点客户端 李孟霏在刚刚过去的国庆中秋“双节”,山东移动威海乳山分公司移动社区营销团队实现品牌口碑与业务发展的双赢
2025-10-10 11:07:00
优优绿能(301590)成立于2015年,是国内直流充电桩模块领军企业之一,2024年在国内充电模块市占率达16%,位居行业第二
2025-10-10 23:06:00
恒润达生信披“迷雾”:“消失”的研发总监与首席科学家?
除研发核心人员离职或在外创办同行业企业外,上海恒润达生生物科技股份有限公司(下称“恒润达生”)招股书对研发团队人员信披的真实性
2025-10-10 23:06:00
互联网贷款普及后,不少初次接触的用户常因平台选择难、流程不熟悉犯愁。其实只要按步骤操作执行,安全又高效,下面由榕易有钱为大家梳理了几项关键步骤
2025-10-10 11:34:00
从志愿翻译到时装新星 河南姑娘在非洲书写青春与梦想
大河网讯 非洲大陆,机遇与挑战并存。越来越多的中国人选择在这里扎根创业,为当地发展注入新活力。毕业于河南工业大学的何方方便是其中之一
2025-10-10 12:11:00
姜杰秀:心中有梦,创业有方,用执着与努力让喜龙果出海
鲁网10月10日讯“我父亲就是做农副产品加工的,从小受父亲的熏陶,我对农副产品加工就有别样的情愫。于是,我就在农副产品加工上有了梦想
2025-10-10 13:56:00
中新经纬10月10日电 “市说新语”微信号10日消息,近日,国家市场监管总局(国家标准委)批准发布一批重要国家标准,涉及助老扶幼
2025-10-10 14:06:00
解锁工业自动化密码,威图与易盼2025IAS硬核破圈瞬间
"新质驱动、高端引领、数智赋能" ,2025中国国际工业博览会聚焦新工业新经济,旨在拉开加快构建一流产业生态,开启智能制造新时代的帷幕
2025-10-10 14:59:00
圆满收官 | 威图RiLineX全新一代配电平台正式发布
制造业行业数字化与智能化水平要求日益提升,这意味着制造业将面临集人力、技术、时间和成本全面优化的巨大挑战。配电系统作为工业场景下能源传输的载体
2025-10-10 14:59:00
河北日报讯(许君强、李晴宇)9月24日,2025河北国际工业设计周辛集分会场活动在辛集市工业设计创新中心启动。此次分会场以“跨界融合·创新设计”为主题
2025-10-10 15:23:00
中新经纬10月10日电 题:这届年轻人,为什么抢着把“国宝”贴冰箱上作者 周慎 中国科大先研院人工智能文旅融合研究院执行院长十一黄金周刚过
2025-10-10 15:45:00