• 我的订阅
  • 科技

openaigpt-4o登顶竞技场排行榜

类别:科技 发布时间:2024-05-15 13:37:00 来源:浅语科技

5月14日消息,OpenAI员工WilliamFedus周一在社交平台X证实,近期在LMSYS聊天机器人竞技场(ChatbotArena)上表现优异的神秘聊天机器人“gpt-chatbot”,正是他们刚刚发布的全新人工智能模型GPT-4o。Fedus还透露,GPT-4o在测试中登顶了竞技场排行榜,取得了有史以来的最高分。

openaigpt-4o登顶竞技场排行榜

“GPT-4o是我们最先进的尖端模型,”Fedus在推特上写道,“我们一直在竞技场使用‘im-also-a-good-gpt2-chatbot’的名称测试该模型的一个版本。”

openaigpt-4o登顶竞技场排行榜

聊天机器人竞技场是一个网站,访客可以同时与两个随机的AI语言模型对话,却不知道哪个是哪个,然后选择提供更好回复的模型。

从今年4月份开始,OpenAI在竞技场测试了多个版本的GPT-4o,该模型最初以“gpt2-chatbot”的名称出现,然后变成了“im-a-good-gpt2-chatbot”,最后是“im-also-a-good-gpt2-chatbot”。

自GPT-4o今日发布以来,多方消息人士透露,该模型以巨大优势登顶了LMSYS的内部排行榜,超越了之前排名最高的模型Claude3Opus和GPT-4Turbo。

lmsys.org的官方账号分享了一张图表,并写道:“‘gpt2-chatbot’系列模型刚刚飙升至榜首,以显著的优势(约50Elo)超越了所有其他模型,它已经成为竞技场中最强大的模型。这是一张内部截图,公开版本的‘gpt-4o’现已进入竞技场,并很快将出现在公开排行榜上!”

openaigpt-4o登顶竞技场排行榜

截至IT之家发稿时,“im-also-a-good-gpt2-chatbot”的Elo分数为1309,领先于GPT-4-Turbo-2023-04-09的1253分和Claude3Opus的1246分。在三个“gpt2-chatbot”出现并搅局之前,Claude3和GPT-4Turbo一直在排行榜上争夺冠军。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-15 19:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

起猛了,GPT-4o被谷歌新模型击败,ChatGPT官号:大家深吸一口气
...2000人匿名投票,Gemini 1.5 Pro(0801)代表谷歌首次夺得lmsys竞技场第一。(中文任务也第一)而且这次还是双冠王
2024-08-05 09:36:00
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
【新智元导读】以开源极客之姿杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B
2024-11-20 09:43:00
腾讯混元首次上榜Chatbot Arena排名:跻身全球Top 15
...,腾讯官方发文宣布,腾讯混元首次上榜海外权威大模型竞技场 Chatbot Arena最新排名,跻身全球 Top 15
2025-03-20 00:27:00
逆水寒“ai竞技场”将于11月22日正式上线
...日,国风MMO手游逆水寒宣布将在其2.2.2新版本中上线“AI竞技场”功能,这一创新举措旨在通过游戏平台,汇聚广大玩家力量,对当下热门的AI大模型进行客观评估。据悉,逆水寒“
2024-11-21 10:46:00
《哎呀好身材·奔赴季》定档,百位体能强者上演力量美与运动美
...呀好身材·奔赴季》也重启了观察室环节,“真人秀+棚内竞技场+观察室的”全新模式让节目增添了许多亮点。通过能量助力官们的沉浸式观察和深度体验,观众能更直观地感受到竞技体育的魅力
2023-10-04 11:04:00
国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10
...式对外发布新旗舰模型——Yi-Lightning(闪电)。在大模型竞技场(Chatbot Arena)上,Yi-Lightning性能直冲总榜单并列第6
2024-10-17 09:48:00
GPT-4o mini登顶大模型竞技场,奥特曼:两个月内微调免费
...刚,GPT-4o mini版迎来“高光时刻”——登顶了lmsys大模型竞技场,和满血版并列第一,还把Claude 3
2024-07-25 09:31:00
GPT-4omini为啥登顶竞技场?OpenAI刷分秘诀被扒,奥特曼早有暗示
为啥GPT-4o mini能登顶大模型竞技场??原来是OpenAI会刷分呀。这两天,lmsys竞技场公布了一份充满争议的榜单
2024-07-30 09:30:00
...海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena,首度集齐国内主流大模型全阵容,阿里通义千问、百度文心一言、腾讯混元、字节跳动豆包、书生·浦
2024-06-02 05:34:00
更多关于科技的资讯:
零的突破!云知声中标全国首个省级医保大模型项目,打通医保治理现代化“最后一公里”
2026年开年,智慧医保领域迎来里程碑式突破——云知声智能科技股份有限公司成功中标全国首个省级医保垂直大模型项目“江苏省医保垂直大模型及智能体应用项目”
2026-01-24 17:26:00
香港大学中国商业学院2026年专业研究生文凭课程火热招生中
香港大学中国商业学院2026年专业研究生文凭课程全面启动招生!课程涵盖人工智能、创新管理、增长营销、财务金融、人力资源等前沿及核心商管领域
2026-01-24 17:27:00
当哲思遇见科技:华为阅读携手周国平,探讨如何在独处中沉淀自我
在信息纷扰、节奏加速的时代,何处寻得一方宁静,让思想深度扎根?华为阅读联合北京广播电视台纪实科教频道《我们读书吧》第二季
2026-01-24 17:29:00
1月8日,深圳市精锋医疗科技股份有限公司(以下简称精锋医疗)在香港联合交易所主板成功挂牌上市,成为2026年深圳IPO“第一股”
2026-01-24 17:29:00
赋能普惠,引领向善:龙环汇丰实践获公益节大奖肯定
1月22日,第十五届公益节暨2025ESG影响力年会在北京盛大开幕。本届大会以“15年,共益新篇章”为主题,回顾中国公益事业十五年发展历程
2026-01-24 17:30:00
鸿蒙 6“智感握姿” 让交互体验更“近”一步
你是否也经历过这样“手忙脚乱”的时刻:出差途中单手提包,电话突然响起,另一只手紧紧攥着手机,大拇指却怎么也够不到那段长长的滑动接听条
2026-01-24 17:27:00
蚌埠这场脑机接口大会,让“大脑连接未来”照进现实!
大皖新闻讯 1月23日至25日,安徽省脑机接口创新发展大会在蚌埠隆重启幕。为期三天的盛会汇聚了300余位来自高等院校、科研院所
2026-01-24 16:54:00
固体废物综合治理是生态文明建设的重要内容,也是推进美丽中国建设的关键环节。近日,国务院办公厅印发《固体废物综合治理行动计划》
2026-01-24 12:14:00
鲁网1月24日讯国家新一轮消费品以旧换新及数码智能产品购新补贴政策红利持续释放。作为通信行业标杆企业,山东移动济宁分公司积极响应国家号召
2026-01-24 14:00:00
提供16万多方生态空间 设立7亿元资本活水每日商报讯 眼下,“AI漫剧”正加速走入公众视野。作为人工智能时代下中国文化“新三样”(网文
2026-01-24 10:59:00
固安搭建AI智慧招商平台 30秒生成企业选址方案
1月20日,“立业固安”平台工作人员(中)通过平台向企业推荐合适的选址方案。 万 倩摄河北日报讯(记者刘英)30秒,生成一份定制化的选址方案
2026-01-24 08:19:00
近日,杭州德胜快速路(石德立交至明石路段)、秋石快速路(石德立交-石石立交)两项夜景照明提升工程顺利竣工。具体有哪些改变
2026-01-24 09:28:00
距离过年只剩大半个月时间,今年的年货你已经准备好了吗?本周日,100多个AI高手将集结在杭州东站的中国数谷·未来数智港
2026-01-24 10:29:00
来雄安,体验智能弹性绿波带
来雄安,体验智能弹性绿波带主要道路早晚高峰通行缩短15分钟近日,雄安新区容东片区乐民街的数字化道路上,车辆顺畅通行。 河北日报记者 刘光昱摄河北日报讯(见习记者康晓博)从雄安新区工信科技数据局获悉
2026-01-24 08:27:00
太重集团1月21日发布消息,太重首批32米纯电直臂式高空作业平台顺利批量下线,这不仅是太重高空作业平台产品型谱的重要补位
2026-01-24 07:17:00