• 我的订阅
  • 科技

openaigpt-4o登顶竞技场排行榜

类别:科技 发布时间:2024-05-15 13:37:00 来源:浅语科技

5月14日消息,OpenAI员工WilliamFedus周一在社交平台X证实,近期在LMSYS聊天机器人竞技场(ChatbotArena)上表现优异的神秘聊天机器人“gpt-chatbot”,正是他们刚刚发布的全新人工智能模型GPT-4o。Fedus还透露,GPT-4o在测试中登顶了竞技场排行榜,取得了有史以来的最高分。

openaigpt-4o登顶竞技场排行榜

“GPT-4o是我们最先进的尖端模型,”Fedus在推特上写道,“我们一直在竞技场使用‘im-also-a-good-gpt2-chatbot’的名称测试该模型的一个版本。”

openaigpt-4o登顶竞技场排行榜

聊天机器人竞技场是一个网站,访客可以同时与两个随机的AI语言模型对话,却不知道哪个是哪个,然后选择提供更好回复的模型。

从今年4月份开始,OpenAI在竞技场测试了多个版本的GPT-4o,该模型最初以“gpt2-chatbot”的名称出现,然后变成了“im-a-good-gpt2-chatbot”,最后是“im-also-a-good-gpt2-chatbot”。

自GPT-4o今日发布以来,多方消息人士透露,该模型以巨大优势登顶了LMSYS的内部排行榜,超越了之前排名最高的模型Claude3Opus和GPT-4Turbo。

lmsys.org的官方账号分享了一张图表,并写道:“‘gpt2-chatbot’系列模型刚刚飙升至榜首,以显著的优势(约50Elo)超越了所有其他模型,它已经成为竞技场中最强大的模型。这是一张内部截图,公开版本的‘gpt-4o’现已进入竞技场,并很快将出现在公开排行榜上!”

openaigpt-4o登顶竞技场排行榜

截至IT之家发稿时,“im-also-a-good-gpt2-chatbot”的Elo分数为1309,领先于GPT-4-Turbo-2023-04-09的1253分和Claude3Opus的1246分。在三个“gpt2-chatbot”出现并搅局之前,Claude3和GPT-4Turbo一直在排行榜上争夺冠军。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-15 19:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

起猛了,GPT-4o被谷歌新模型击败,ChatGPT官号:大家深吸一口气
...2000人匿名投票,Gemini 1.5 Pro(0801)代表谷歌首次夺得lmsys竞技场第一。(中文任务也第一)而且这次还是双冠王
2024-08-05 09:36:00
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
【新智元导读】以开源极客之姿杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B
2024-11-20 09:43:00
腾讯混元首次上榜Chatbot Arena排名:跻身全球Top 15
...,腾讯官方发文宣布,腾讯混元首次上榜海外权威大模型竞技场 Chatbot Arena最新排名,跻身全球 Top 15
2025-03-20 00:27:00
逆水寒“ai竞技场”将于11月22日正式上线
...日,国风MMO手游逆水寒宣布将在其2.2.2新版本中上线“AI竞技场”功能,这一创新举措旨在通过游戏平台,汇聚广大玩家力量,对当下热门的AI大模型进行客观评估。据悉,逆水寒“
2024-11-21 10:46:00
《哎呀好身材·奔赴季》定档,百位体能强者上演力量美与运动美
...呀好身材·奔赴季》也重启了观察室环节,“真人秀+棚内竞技场+观察室的”全新模式让节目增添了许多亮点。通过能量助力官们的沉浸式观察和深度体验,观众能更直观地感受到竞技体育的魅力
2023-10-04 11:04:00
国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10
...式对外发布新旗舰模型——Yi-Lightning(闪电)。在大模型竞技场(Chatbot Arena)上,Yi-Lightning性能直冲总榜单并列第6
2024-10-17 09:48:00
GPT-4o mini登顶大模型竞技场,奥特曼:两个月内微调免费
...刚,GPT-4o mini版迎来“高光时刻”——登顶了lmsys大模型竞技场,和满血版并列第一,还把Claude 3
2024-07-25 09:31:00
GPT-4omini为啥登顶竞技场?OpenAI刷分秘诀被扒,奥特曼早有暗示
为啥GPT-4o mini能登顶大模型竞技场??原来是OpenAI会刷分呀。这两天,lmsys竞技场公布了一份充满争议的榜单
2024-07-30 09:30:00
...海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena,首度集齐国内主流大模型全阵容,阿里通义千问、百度文心一言、腾讯混元、字节跳动豆包、书生·浦
2024-06-02 05:34:00
更多关于科技的资讯:
82岁老人换了新手机,但不熟悉操作,结果误开通多项收费业务。3月11日,老人收到扣费短信后向网格员求助,顺利取消了扣费服务
2026-03-11 17:36:00
中新经纬3月11日电 (董湘依)近年来,中国文化“新三样”(网文、网剧、网游)在海外迅速走红。全国两会期间,全国政协委员
2026-03-11 19:27:00
中新经纬3月11日电 题:“养龙虾”火出圈 ,算力变成稀缺资源作者 薛洪言 星图金融研究院常务副院长、苏商银行特约研究员2026年的早春
2026-03-11 19:28:00
河北新闻网讯(闫丽颖、唐福刚)近日,开滦股份范各庄矿聚焦“物理隔离+智能管控”核心需求,创新应用一套具备智能闭锁、声光报警
2026-03-11 19:51:00
中国联通eSIM尝鲜季再添新力
3月11日上午,中国联通eSIM尝鲜季——三星国内首款eSIM手机Galaxy S26系列首销仪式在西单北营业厅隆重举行
2026-03-11 14:14:00
大皖新闻讯 家里空调、冰箱等家电出故障,找维修却怕遇上“小病大修”“坐地起价”。别愁,专为安徽消费者打造的家电维修“放心平台”来了
2026-03-11 14:55:00
近日,备受瞩目的2025年度“吴文俊人工智能科学技术奖”获奖名单正式揭晓。罗普特(股票代码:688619.SH)作为主要完成单位参与的《面向海上安防的通感算一体化大数据智能处理关键技术及产业化》项目
2026-03-11 15:01:00
新华保险“空中柜面”让保单服务零距离
鲁网3月11日讯“您好,欢迎使用新华保险空中柜面服务!”当客户通过手机视频联系接通后台柜员时,这一句温暖的问候便会准时响起
2026-03-11 16:35:00
新华社记者 曾晋“你‘养龙虾’了吗?”这句略显无厘头的有趣问话,说的可是最近科技圈的一件大事。此“龙虾”并非餐桌上的美味
2026-03-11 16:02:00
长白时评评论员 丁铁巴基斯坦独立新闻社日前报道,曾是大型农场专属的现代农业机械化,正因中国农机驶入全球田间地头被改写,手工耕作的辛劳正被高效的机械作业替代
2026-03-11 11:32:00
降噪新科技,轻松听清晰,潜能发展更可期----科利耳Nucleus™ 8以创新聆听赋能成长
在移动互联高度发达的当下,听损人士的生活场景愈发多元:孩子们在游乐场嬉戏,笑声与广播声交织;学生们在校园里讨论,声音此起彼伏
2026-03-11 13:01:00
海湾深化转型,打造第二增长曲线
2025年,海湾安全技术有限公司(以下简称"海湾")迈入发展新阶段,在消防行业深度变革的浪潮中交出了一份亮眼的答卷。新年伊始
2026-03-11 13:02:00
八马以科技为翼,武夷山超级工厂破解茶行业非标发展桎梏
中国茶行业千年发展,却长期受困于“非标”痛点,品质参差、产能有限成为行业升级的最大阻碍。而作为“高端中国茶第一股”的八马茶业
2026-03-11 13:04:00
实现社保一站式便民服务厦门“汇智办”让缴费人“会自办”东南网3月11日讯(海峡导报记者 孙春燕 通讯员 杨楠欢 叶璐璐 廖皓宇) 受春节过后的“返工潮”影响
2026-03-11 13:46:00
探路制造出海“关键一跃”:华南师范大学调研团队走进华翱集团
面对复杂多变的国际环境,佛山制造业正迎来新一轮深度转型的关键期。从深耕国内市场到逐鹿全球蓝海,如何实现从单一“产品出海”向涵盖“技术-制造-品牌”的全链条出海跨越
2026-03-11 13:04:00