• 我的订阅
  • 头条热搜
国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10
...式对外发布新旗舰模型——Yi-Lightning(闪电)。在大模型竞技场(Chatbot Arena)上,Yi-Lightning性能直冲总榜单并列第6,数学分榜并列第3,代码等其它分榜也名列前茅。总成绩几乎与马斯克最新xAI大模型Grok-2-08-13持平,超越GPT-4o-20...……更多
...海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena,首度集齐国内主流大模型全阵容,阿里通义千问、百度文心一言、腾讯混元、字节跳动豆包、书生·浦语等20款国产大模型出战,角逐中国大模型“最强...……更多
...,360 通过 CoE 技术架构,构建了大模型竞技平台——模型竞技场(bot.360.com),目前已经入驻360AI浏览器,成为国内大模型领域的基础设施。在多模型协作模式下,用户可以从 16 家国内主流大模型厂商的 54 款大模型中任意选择 3 款...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...而且它登上的这个排行榜LiveBench,虽然现在还没有大模型竞技场(LMSYS Chatboat Arena)那么广为人知,但资格杠杠的——图灵奖得主、Meta首席AI科学家杨立昆(Yann LeCun),联合纽约大学等在今年6月推出。号称是“全球首个无法作...……更多
逆水寒“ai竞技场”将于11月22日正式上线
...日,国风MMO手游逆水寒宣布将在其2.2.2新版本中上线“AI竞技场”功能,这一创新举措旨在通过游戏平台,汇聚广大玩家力量,对当下热门的AI大模型进行客观评估。据悉,逆水寒“AI竞技场”将邀请国内多家知名AI厂商参与,包...……更多
openaigpt-4o登顶竞技场排行榜
...工WilliamFedus周一在社交平台X证实,近期在LMSYS聊天机器人竞技场(ChatbotArena)上表现优异的神秘聊天机器人“gpt-chatbot”,正是他们刚刚发布的全新人工智能模型GPT-4o。Fedus还透露,GPT-4o在测试中登顶了竞技场排行榜,取得了有史以...……更多
to B要挣钱、to C要谨慎,李开复的大模型坚持
10月15日深夜,零一万物的Yi-Lighting大模型在LMSYS盲测竞技场的投票数超过1万次,拿到了这个国际权威测试榜单的入场券,\"出来的结果是,我们排在全球第六\",10月16日上午,零一万物CEO李开复向媒体宣布时一字一顿。为了强调...……更多
GPT-4o mini登顶大模型竞技场,奥特曼:两个月内微调免费
...刚,GPT-4o mini版迎来“高光时刻”——登顶了lmsys大模型竞技场,和满血版并列第一,还把Claude 3.5甩在了身后。不同于一般的数据集测评,大模型竞技场是用户自己出题、用脚投票的结果,无法通过“刷题”来走捷径,因此更为...……更多
起猛了,GPT-4o被谷歌新模型击败,ChatGPT官号:大家深吸一口气
...2000人匿名投票,Gemini 1.5 Pro(0801)代表谷歌首次夺得lmsys竞技场第一。(中文任务也第一)而且这次还是双冠王,除了总榜(唯一分数上1300),在视觉排行榜上也是第一。Gemini团队的关键人物Simon Tokumine发文庆祝称:(这一新模...……更多
奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了
...新模型,真的藏不住了!先是有匿名聊天机器人现身lmsys竞技场,声称自己是GPT-4系列模型一部分,吊足了大家的胃口。随后奥特曼又发了一个浮想联翩的推文,正是他花园里的草莓照片,并配文:i love summer in the garden。上个月Op...……更多
GPT-4omini为啥登顶竞技场?OpenAI刷分秘诀被扒,奥特曼早有暗示
为啥GPT-4o mini能登顶大模型竞技场??原来是OpenAI会刷分呀。这两天,lmsys竞技场公布了一份充满争议的榜单。其中才面世不久的GPT-4o mini和满血版并列第一,把Claude 3.5 Sonnet甩在身后。结果网友炸锅了,大家凭体感觉得这不可能...……更多
帝都、魔都双双押宝 年底了AI圈居然还有高手
...024-11-19而阶跃的 “ 第二步 ”Step-1V 走的也不错。拿?模型竞技场 Chatbot Arena 的数据来看,这个竞技场网站里网友们可以试用所有的大模型,然后给它们打分,今年 11 ?的榜单里 Step-1V 的总分已经达到了 Gemini1.5 的水平。除了这些...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
【新智元导读】以开源极客之姿杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...最强大模型。历经一年多追赶,国产大模型终于进入核心竞技场,可与国外一流大模型一较高下。奋力追赶一年,成就最强中文大模型大模型技术爆发一年多,行业竞争态势激烈而又多变。通义千问走了一条最“卷”的路,2023...……更多
OpenAI 再成“榜一大哥”:o1-preview AI 模型驾驭数学等任务
... Decoder 昨日(9 月 19 日)发布博文,报道称在聊天机器人竞技场(Chatbot Arena)上,OpenAI 的新人工智能模型 o1-preview 和 o1-mini 问鼎榜首。聊天机器人竞技场简介聊天机器人竞技场是一个比较人工智能模型的平台,它利用 6000 多个...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
...务的版本。还是在360AI浏览器中,AI助手还上线了“模型竞技场”(bot.360.com),支持54款大模型产品的“同台竞技”,最新版本中还上线了“组队较量”、“匿名比拼”、“随机对战”等功能。总的来说,360AI搜索还是360AI浏览器...……更多
神秘模型“小熊猫”一夜刷屏:排名超Flux、Midjourney
...”(小熊猫)的神秘文生图模型狠狠火了!!登顶文生图竞技场,直接将Flux、Midjourney等一众顶尖模型踩在脚下——其ELO得分比Flux 1.1 Pro高出100多,胜率高达79%,每7秒就能生成一张图像。生成效果be like:啥概念呢?按网友的话...……更多
大模型价格战“卷”向何方?|深度
...型Yi-Large以总榜第7名的成绩,进入了世界权威的LMSYS 盲测竞技场排行榜。“我觉得我们的价钱是合适、值得的。如果说以后可能中国就是这么‘卷’,大家都宁可赔光、双输也不让你赢,我们就走外国市场。”李开复说。(科创...……更多
谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑
...至还能与其两倍大的模型竞争。目前Gemma 2已入驻大模型竞技场(LMSYS Chatbot Arena),Gemma 2 27B排名与Llama3 70B相当:而Gemma 2 9B的排名甚至比肩Qwen 2 72B:该结果也让网友纷纷表示难以置信。 此外,VentureBeat表示,两种……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...人工智能实验室(GAIR Lab)推出的OlympicArena[1] (奥林匹克竞技场)满足了这个需求。奥林匹克学科竞赛不仅是对人类(碳基智能)思维敏捷性、知识掌握和逻辑推理的极限挑战,更是AI(“硅基智能”)锻炼的绝佳练兵场,是衡...……更多
开源版OpenAI再出「神作」,小模型吊打Llama 3!Ministral系列问世,边缘AI革命开启
...及前辈模型Mistral 7B。而且Ministral 3B和Ministral 8B在大模型竞技场中的测试,均拿下了媲美Gemma 2、Llama 3.1开源模型的成绩。 世界上最好的边缘模型Ministral 3B和Ministral 8B都支持高达128k上下文(目前在vLLM上为32……更多
全国技能大赛:不仅是竞技场还是“风向标”
...专业发展建设 提升人才培养标准全国技能大赛:不仅是竞技场还是“风向标”第二届职业技能大赛选手正在进行木工项目比赛。新华社记者 赵子硕摄◎本报记者 孙明源 陈 曦第二届全国技能大赛近日在天津闭幕。与首届大赛相...……更多
国产大模型加速落地,争夺“中国版ChatGPT”心智定位
...相落地,国产大模型进入了新的竞争阶段。5月7日,零一万物官宣了一站式AI工作平台——万知。据官方介绍,万知可以帮助用户做会议纪要、周报、写作助手,还可以解读财报、论文等各类文件,也可以实现PPT的图文制作。这...……更多
零一万物新模型 Yi-Lightning 发布:LMSYS 测试国产首超 GPT-4o
IT之家 10 月 17 日消息,李开复创办的 AI 公司零一万物于 10 月 16 日对外发布新旗舰模型 Yi-Lightning。在盲测榜单LMSYS上,Yi-Lightning超越 OpenAI、Anthropic 所发布的GPT-4o-2024-05-13、 Claude 3.5 Sonn……更多
零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新
...部在 OpenAI 发布会的前一天,来自中国的大模型公司零一万物,让开源大模型社区活跃了起来:Yi 大模型家族新成员「Yi-1.5」模型正式开源。在项目主页可以看到,Yi-1.5 包括一系列预训练和微调模型,分为 6B、9B、34B 三个版本,...……更多
零一万物新模型盲测国产首超GPT-4o!李开复透露:一次训练成本超2000万
快科技10月17日消息,日前李开复的零一万物公司,正式对外发布了新旗舰模型Yi-Lightning。在盲测榜单LMSYS中,Yi-Lightning位列第六,仅次于OpenAI的GPT-4o、o1系列,Google的Gemini 1.5 pro系列,与马斯克xAI旗下Grok-2打平。值得一提的是……更多
阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果
...业内的怀疑对象指向刚发布首款预训练大模型Yi-34B的零一万物,其是李开复在今年7月入局AI大模型新成立的公司,由李开复牵头创办并担任CEO。搜狐科技注意到,零一万物开源发布的Yi-34B模型目前在Hugging Face的Open LLM Leaderboard开...……更多
谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo
...2 模型系列,并且自亮相以来,27B 版本迅速成为了大模型竞技场 LMSYS Chatbot Arena 中排名最高的开放模型之一,在真实对话任务中比其两倍规模以上的模型表现还要好。如今,仅仅过去了一个多月,谷歌在追求负责任 AI 的基础上...……更多
新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜
...谷歌的Gemini也上线了新的实验版模型,再一次登上大模型竞技场榜首。有网友感叹,o1、Llama 3.3和新版Gemini接连发布,马斯克的Grok3也要来,还有GPT-4.5初露端倪……这简直是最棒的一个圣诞季。Llama 3.3:70B实现405B效果Llama 3.3目前...……更多
Meta AI首席科学家杨立昆谈DeepSeek:不是中国AI超越美国 而是开源模型超越专有模型
...风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第一,其竞技场得分达到1357分,略超OpenAI o1的1352分。DeepSeek-R1的发布极大震动了美国科技界,不仅因其性能上比肩OpenAI o1,且完全开源,还以极低的成本实现了这一突破。【本文...……更多
更多关于科技的资讯:
18.05亿元前所未有!蛇年大年初一票房创造历史新纪录
快科技1月30日消息,根据国家电影局统计,2025年春节大年初一(1月29日)票房为18.05亿元,观影人次为3515
2025-01-30 11:08:00
台湾嘉义县发生5.2级地震 福建多地震感明显
快科技1月30日消息,据中国地震台网正式测定:01月30日10时11分在台湾嘉义县(北纬23.25度,东经120.57度)发生5
2025-01-30 11:38:00
又一车企妥协:阿尔法·罗密欧即将放弃2027年全面电动化目标
快科技1月30日消息,日前,阿尔法·罗密欧宣布将放弃2027年在北美全面实现电动化的目标,转而采用多种动力形式并举的战略
2025-01-30 12:08:00
索尼PSN政策再度生变
如果没有发生PSN风波,地狱里的老司机应该比现在更多——索尼去年在PC平台同步推出GaaS游戏《地狱潜行者2》时,请君入瓮后又强制要求玩家登录PSN账号
2025-01-30 12:08:00
美国一架客机与一架直升机空中相撞坠河 客机上有约60名乘客
快科技1月30日消息,据美国联邦航空管理局消息,1月29日晚,在接近罗纳德·里根华盛顿国家机场跑道时,一架客机与一架直升机相撞
2025-01-30 12:08:00
余承东称将引发全国人民抢购!华为重磅新品3月发布:或是全新折叠产品
快科技1月30日消息,近日余承东直播时又主动爆料称,华为即将发布重磅新品。直播中,余承东透露了华为即将发布的一款意想不到的新品
2025-01-30 13:38:00
韩国客机烧出一个大洞:可能因充电宝 行李架蹿出火花
快科技1月30日消息,据报道,28日晚,釜山航空BX391次航班在准备起飞阶段突发火灾。在紧急撤离过程中,由于吸入烟气等原因
2025-01-30 13:38:00
为降低成本:日产宣布三家工厂裁员并减少班次
快科技1月30日消息,日产汽车宣布正在削减美国三家工厂的部分生产班次,并向田纳西州士麦那和密西西比州坎顿的整车装配厂以及田纳西州德彻德的发动机厂员工提供离职补偿方案
2025-01-30 15:38:00
赵雅芝 蛇年最忙的女人:73岁高龄身材、颜值依然抗打 网友感慨
1月30日消息,中国香港女演员赵雅芝可能是蛇年最忙碌的艺人之一。据悉,71岁的赵雅芝受国内9家电视台邀请,现身它们的“春晚”舞台
2025-01-30 15:38:00
法国耗资540亿欧元AI推出3天后下架:错误频出 建议用户吃牛蛋
快科技1月30日消息,据报道,法国近期斥资540亿欧元推出了一款名为Lucie的法语AI聊天机器人,然而,由于其表现过于离谱
2025-01-30 16:08:00
特斯拉:2025年上半年将推平价车型 预计售价3万美元
快科技1月30日消息,特斯拉在财报电话会议上宣布,车辆平均制造成本首次降至3.5万美元(约25.4万元人民币)以下。此外
2025-01-30 16:08:00
全长超4000米!纳赫高速首条特长高瓦斯隧道双幅贯通
快科技1月30日消息,据“中国能建”官微发文,中国能建葛洲坝集团承建的纳赫高速一标段项目首条特长高瓦斯隧道——四新隧道双幅贯通
2025-01-30 16:38:00
马斯克公布特斯拉FSD入华难点:错综复杂的公交车道
快科技1月30日消息,特斯拉公布第四季度及全年财报,Q4总营收为257.07亿美元,同比增长2%;2024年总营收达977亿美元
2025-01-30 16:38:00
全新奥迪Q3冬测谍照曝光:最后一款提供燃油发动机的Q3车型
快科技1月30日消息,日前,外媒曝光了一组新款奥迪Q3 Sportback的冬测照片,这将是最后一款提供燃油发动机的Q3车型
2025-01-30 17:08:00
机器人不止会跳舞
蛇年春晚上,穿着花棉袄、转着花手绢扭秧歌的机器人看呆了观众。去掉了皮肤之后的人形机器人,浓浓的机械感与柔美的舞蹈形成了鲜明对比
2025-01-30 17:21:00