• 我的订阅
  • 科技

openaigpt-4o登顶竞技场排行榜

类别:科技 发布时间:2024-05-15 13:37:00 来源:浅语科技

5月14日消息,OpenAI员工WilliamFedus周一在社交平台X证实,近期在LMSYS聊天机器人竞技场(ChatbotArena)上表现优异的神秘聊天机器人“gpt-chatbot”,正是他们刚刚发布的全新人工智能模型GPT-4o。Fedus还透露,GPT-4o在测试中登顶了竞技场排行榜,取得了有史以来的最高分。

openaigpt-4o登顶竞技场排行榜

“GPT-4o是我们最先进的尖端模型,”Fedus在推特上写道,“我们一直在竞技场使用‘im-also-a-good-gpt2-chatbot’的名称测试该模型的一个版本。”

openaigpt-4o登顶竞技场排行榜

聊天机器人竞技场是一个网站,访客可以同时与两个随机的AI语言模型对话,却不知道哪个是哪个,然后选择提供更好回复的模型。

从今年4月份开始,OpenAI在竞技场测试了多个版本的GPT-4o,该模型最初以“gpt2-chatbot”的名称出现,然后变成了“im-a-good-gpt2-chatbot”,最后是“im-also-a-good-gpt2-chatbot”。

自GPT-4o今日发布以来,多方消息人士透露,该模型以巨大优势登顶了LMSYS的内部排行榜,超越了之前排名最高的模型Claude3Opus和GPT-4Turbo。

lmsys.org的官方账号分享了一张图表,并写道:“‘gpt2-chatbot’系列模型刚刚飙升至榜首,以显著的优势(约50Elo)超越了所有其他模型,它已经成为竞技场中最强大的模型。这是一张内部截图,公开版本的‘gpt-4o’现已进入竞技场,并很快将出现在公开排行榜上!”

openaigpt-4o登顶竞技场排行榜

截至IT之家发稿时,“im-also-a-good-gpt2-chatbot”的Elo分数为1309,领先于GPT-4-Turbo-2023-04-09的1253分和Claude3Opus的1246分。在三个“gpt2-chatbot”出现并搅局之前,Claude3和GPT-4Turbo一直在排行榜上争夺冠军。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-15 19:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

起猛了,GPT-4o被谷歌新模型击败,ChatGPT官号:大家深吸一口气
...2000人匿名投票,Gemini 1.5 Pro(0801)代表谷歌首次夺得lmsys竞技场第一。(中文任务也第一)而且这次还是双冠王
2024-08-05 09:36:00
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
【新智元导读】以开源极客之姿杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B
2024-11-20 09:43:00
腾讯混元首次上榜Chatbot Arena排名:跻身全球Top 15
...,腾讯官方发文宣布,腾讯混元首次上榜海外权威大模型竞技场 Chatbot Arena最新排名,跻身全球 Top 15
2025-03-20 00:27:00
逆水寒“ai竞技场”将于11月22日正式上线
...日,国风MMO手游逆水寒宣布将在其2.2.2新版本中上线“AI竞技场”功能,这一创新举措旨在通过游戏平台,汇聚广大玩家力量,对当下热门的AI大模型进行客观评估。据悉,逆水寒“
2024-11-21 10:46:00
《哎呀好身材·奔赴季》定档,百位体能强者上演力量美与运动美
...呀好身材·奔赴季》也重启了观察室环节,“真人秀+棚内竞技场+观察室的”全新模式让节目增添了许多亮点。通过能量助力官们的沉浸式观察和深度体验,观众能更直观地感受到竞技体育的魅力
2023-10-04 11:04:00
国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10
...式对外发布新旗舰模型——Yi-Lightning(闪电)。在大模型竞技场(Chatbot Arena)上,Yi-Lightning性能直冲总榜单并列第6
2024-10-17 09:48:00
GPT-4o mini登顶大模型竞技场,奥特曼:两个月内微调免费
...刚,GPT-4o mini版迎来“高光时刻”——登顶了lmsys大模型竞技场,和满血版并列第一,还把Claude 3
2024-07-25 09:31:00
GPT-4omini为啥登顶竞技场?OpenAI刷分秘诀被扒,奥特曼早有暗示
为啥GPT-4o mini能登顶大模型竞技场??原来是OpenAI会刷分呀。这两天,lmsys竞技场公布了一份充满争议的榜单
2024-07-30 09:30:00
...海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena,首度集齐国内主流大模型全阵容,阿里通义千问、百度文心一言、腾讯混元、字节跳动豆包、书生·浦
2024-06-02 05:34:00
更多关于科技的资讯:
廊坊企业携钢结构全生命周期数字建造管理平台亮相服贸会
河北新闻网讯(周双双)焊枪游走于构件之间,长约1.8米的机械臂带着配套设备,按照预定程序完成现场焊接作业……9月10日
2025-09-13 07:37:00
从园区降碳到聚变研发,新奥积极推动人工智能与能源行业深度融合
河北新闻网讯(张新)近日,国家发展改革委、国家能源局联合印发《关于推进“人工智能+”能源高质量发展的实施意见》,明确提出推动人工智能技术在电网
2025-09-13 07:38:00
中新经纬9月12日电 题:新茶饮出海,何以“全球通”?作者 文志宏 连锁经营产业专家、和弘咨询总经理随着越来越多新茶饮企业步入“万店时代”
2025-09-12 14:36:00
9月11日,中新经纬在2025年服贸会现场探展发现,北京联通为了解决外籍来宾入境支付难和通信难的两大痛点,推出创新产品“畅游通”和“幂方卡”
2025-09-12 14:39:00
中新经纬9月12日电 题:新茶饮出海靠“链”功作者 朱丹蓬 广东省食品安全保障促进会副会长、中国食品产业分析师当喜茶带着现代中国茶文化的魅力走向全球
2025-09-12 14:39:00
汪昌莲日前,高德地图宣布推出首个基于用户行为产生的榜单“高德扫街榜”,构建全新的线下服务信用体系,以全力支持线下餐饮、酒店
2025-09-12 14:40:00
中新经纬9月12日电 题:新茶饮出海,有口味更要有文化味作者 江瀚 盘古智库高级研究员近年来,新茶饮市场出现集体出海热
2025-09-12 14:40:00
聚焦2025服贸会:奇富科技信贷超级智能体升维之路
以“数智领航,服贸焕新”为主题的2025年中国国际服务贸易交易会正在北京召开。在服贸会第七届中国金融科技论坛上,奇富科技展示了其在国家“人工智能+”行动战略指引下
2025-09-12 15:25:00
外媒:中国“国潮”消费正影响国际奢侈品市场
英国《金融时报》报道截图中国高端黄金珠宝品牌老铺黄金近期在国内外市场表现突出,受到全球市场关注。多家外媒认为,近年来中国“国潮”消费趋势正在逐渐影响国际奢侈品市场
2025-09-12 15:25:00
大众网记者 郑健 潍坊报道在潍坊昌邑的产业版图上,一批“隐形冠军”正以惊人的专注力改写行业格局:三力本诺的避蚊胺产量全球领先
2025-09-12 15:29:00
东南网9月12日报道(福建日报记者 廖丽萍)我国钢铁生产需要进口铁矿石,但国际铁矿石市场价格波动频繁,对生产成本管控与盈利稳定性带来了巨大挑战
2025-09-12 15:36:00
安徽黄山烟草:以数智之力 筑安全之基
近年来,安徽省黄山市烟草专卖局(公司)聚焦安全管理现代化目标,深度构建“数智化+安全管理”风险防控体系,以“技术创新突破瓶颈+场景应用落地实效”双轮驱动
2025-09-12 15:42:00
Lux Nutrition健康论坛开幕,聚焦麦角硫因新应用
加拿大保健创新企业 Lux Nutrition 在2025年7月29日在加拿大温哥华 Vancouver Terminal City Club 酒店盛大举行麦角硫因论坛
2025-09-12 15:44:00
雾以希定义鼻腔护理新标准:微米级雾化技术实现家庭精准护理
2025年9月6日,由广州国家实验室、广东省呼吸与健康学会主办,国家呼吸医学研究中心、国家呼吸系统疾病临床医学研究中心
2025-09-12 15:46:00
倒计时一周!设计与科技共振,\
由柯莱睿主办的亚洲权威消费科技与室内设计盛会"设计深圳Design Shenzhen"即将于2025年9月18日至21日在深圳会展中心举办
2025-09-12 15:46:00