• 我的订阅
  • 头条热搜
起猛了,GPT-4o被谷歌新模型击败,ChatGPT官号:大家深吸一口气
起猛了,GPT-4o被谷歌新模型超越了!历时一周,超1,2000人匿名投票,Gemini 1.5 Pro(0801)代表谷歌首次夺得lmsys竞技场第一。(中文任务也第一)而且这次还是双冠王,除了总榜(唯一分数上1300),在视觉排行榜上也是第一。Gemin...……更多
逆水寒“ai竞技场”将于11月22日正式上线
...日,国风MMO手游逆水寒宣布将在其2.2.2新版本中上线“AI竞技场”功能,这一创新举措旨在通过游戏平台,汇聚广大玩家力量,对当下热门的AI大模型进行客观评估。据悉,逆水寒“AI竞技场”将邀请国内多家知名AI厂商参与,包...……更多
openaigpt-4o登顶竞技场排行榜
...工WilliamFedus周一在社交平台X证实,近期在LMSYS聊天机器人竞技场(ChatbotArena)上表现优异的神秘聊天机器人“gpt-chatbot”,正是他们刚刚发布的全新人工智能模型GPT-4o。Fedus还透露,GPT-4o在测试中登顶了竞技场排行榜,取得了有史以...……更多
国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10
...式对外发布新旗舰模型——Yi-Lightning(闪电)。在大模型竞技场(Chatbot Arena)上,Yi-Lightning性能直冲总榜单并列第6,数学分榜并列第3,代码等其它分榜也名列前茅。总成绩几乎与马斯克最新xAI大模型Grok-2-08-13持平,超越GPT-4o-20...……更多
...海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena,首度集齐国内主流大模型全阵容,阿里通义千问、百度文心一言、腾讯混元、字节跳动豆包、书生·浦语等20款国产大模型出战,角逐中国大模型“最强...……更多
GPT-4o mini登顶大模型竞技场,奥特曼:两个月内微调免费
...刚,GPT-4o mini版迎来“高光时刻”——登顶了lmsys大模型竞技场,和满血版并列第一,还把Claude 3.5甩在了身后。不同于一般的数据集测评,大模型竞技场是用户自己出题、用脚投票的结果,无法通过“刷题”来走捷径,因此更为...……更多
奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了
...新模型,真的藏不住了!先是有匿名聊天机器人现身lmsys竞技场,声称自己是GPT-4系列模型一部分,吊足了大家的胃口。随后奥特曼又发了一个浮想联翩的推文,正是他花园里的草莓照片,并配文:i love summer in the garden。上个月Op...……更多
GPT-4omini为啥登顶竞技场?OpenAI刷分秘诀被扒,奥特曼早有暗示
为啥GPT-4o mini能登顶大模型竞技场??原来是OpenAI会刷分呀。这两天,lmsys竞技场公布了一份充满争议的榜单。其中才面世不久的GPT-4o mini和满血版并列第一,把Claude 3.5 Sonnet甩在身后。结果网友炸锅了,大家凭体感觉得这不可能...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
【新智元导读】以开源极客之姿杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭...……更多
OpenAI 再成“榜一大哥”:o1-preview AI 模型驾驭数学等任务
... Decoder 昨日(9 月 19 日)发布博文,报道称在聊天机器人竞技场(Chatbot Arena)上,OpenAI 的新人工智能模型 o1-preview 和 o1-mini 问鼎榜首。聊天机器人竞技场简介聊天机器人竞技场是一个比较人工智能模型的平台,它利用 6000 多个...……更多
神秘模型“小熊猫”一夜刷屏:排名超Flux、Midjourney
...”(小熊猫)的神秘文生图模型狠狠火了!!登顶文生图竞技场,直接将Flux、Midjourney等一众顶尖模型踩在脚下——其ELO得分比Flux 1.1 Pro高出100多,胜率高达79%,每7秒就能生成一张图像。生成效果be like:啥概念呢?按网友的话...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...人工智能实验室(GAIR Lab)推出的OlympicArena[1] (奥林匹克竞技场)满足了这个需求。奥林匹克学科竞赛不仅是对人类(碳基智能)思维敏捷性、知识掌握和逻辑推理的极限挑战,更是AI(“硅基智能”)锻炼的绝佳练兵场,是衡...……更多
开源版OpenAI再出「神作」,小模型吊打Llama 3!Ministral系列问世,边缘AI革命开启
...及前辈模型Mistral 7B。而且Ministral 3B和Ministral 8B在大模型竞技场中的测试,均拿下了媲美Gemma 2、Llama 3.1开源模型的成绩。 世界上最好的边缘模型Ministral 3B和Ministral 8B都支持高达128k上下文(目前在vLLM上为32……更多
全国技能大赛:不仅是竞技场还是“风向标”
...专业发展建设 提升人才培养标准全国技能大赛:不仅是竞技场还是“风向标”第二届职业技能大赛选手正在进行木工项目比赛。新华社记者 赵子硕摄◎本报记者 孙明源 陈 曦第二届全国技能大赛近日在天津闭幕。与首届大赛相...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
...务的版本。还是在360AI浏览器中,AI助手还上线了“模型竞技场”(bot.360.com),支持54款大模型产品的“同台竞技”,最新版本中还上线了“组队较量”、“匿名比拼”、“随机对战”等功能。总的来说,360AI搜索还是360AI浏览器...……更多
...,360 通过 CoE 技术架构,构建了大模型竞技平台——模型竞技场(bot.360.com),目前已经入驻360AI浏览器,成为国内大模型领域的基础设施。在多模型协作模式下,用户可以从 16 家国内主流大模型厂商的 54 款大模型中任意选择 3 款...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
苹果最新杀入开源大模型战场,而且比其他公司更开放。推出7B模型,不仅效果与Llama 3 8B相当,而且一次性开源了全部训练过程和资源。要知道,不久前Nature杂志编辑Elizabeth Gibney还撰文批评:许多声称开源的AI模型,实际上在...……更多
字节版Sora终于来了!一口气两款视频模型,带来的震撼不只一点点
...字节跳动旗下的火山引擎在深圳办了一场 AI 创新巡展,一口气发布了两款视频生成大模型,正式宣告进军 AI 视频生成。这两款模型,一个名为 PixelDance(以下简称 P 模型),一个名为 Seaweed(以下简称 S 模型),不仅在审美、动...……更多
天下手游哪个职业适合平民 天下手游六大职业心得推荐
...,全体加点一个字就是用天机玩法要注意控制衔接,不能一口气连续放控制技能,要有一个衔接,这是手感和意识的问题。还有不要无脑冲,可进可退。魍魉战场套很强,但是属性要洗完美,主要洗会心和穿透,还有力必须要有...……更多
谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo
...2 模型系列,并且自亮相以来,27B 版本迅速成为了大模型竞技场 LMSYS Chatbot Arena 中排名最高的开放模型之一,在真实对话任务中比其两倍规模以上的模型表现还要好。如今,仅仅过去了一个多月,谷歌在追求负责任 AI 的基础上...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...而且它登上的这个排行榜LiveBench,虽然现在还没有大模型竞技场(LMSYS Chatboat Arena)那么广为人知,但资格杠杠的——图灵奖得主、Meta首席AI科学家杨立昆(Yann LeCun),联合纽约大学等在今年6月推出。号称是“全球首个无法作...……更多
OpenAI空降视频生成模型:一口气生成60s,风格画质尺寸灵活定制 | 最前线
文 | 周鑫雨编辑 | 苏建勋2023年4月,成立于纽约的Runway AI发布了一段用AI生成的视频:模糊卡顿、物体扭曲,且仅4秒;四个月后,Runway将文生视频的视频效果拉到了4K的超逼着高度,实现了镜头的连贯稳定。而视频的最大长度也...……更多
谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑
...至还能与其两倍大的模型竞争。目前Gemma 2已入驻大模型竞技场(LMSYS Chatbot Arena),Gemma 2 27B排名与Llama3 70B相当:而Gemma 2 9B的排名甚至比肩Qwen 2 72B:该结果也让网友纷纷表示难以置信。 此外,VentureBeat表示,两种……更多
努比亚一口气发布两款AI手机
今天下午,努比亚一口气发布两款AI手机:努比亚Z60Ultra领先版、努比亚Z60SPro。它们均依托行业领先的自研星云AI大模型,带来独家AI+屏下、独家AI+骁龙最强芯,以及独家Al+卫星通信和独家Al+影像等诸多亮点,为用户带来全方位...……更多
一口气看完超弦理论,弦理论还面临哪些问题,如今为何走向绝路?
弦理论到底有没有前途,它能否承担起解释万物的终极理论?这篇文章咱们讲清楚这个问题首先弦理论是超越科学的一种猜想,另外,如今的弦理论明显已经走进了死胡同。先说结论,弦理论的本质是人类疯狂执迷于万有理论...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...最强大模型。历经一年多追赶,国产大模型终于进入核心竞技场,可与国外一流大模型一较高下。奋力追赶一年,成就最强中文大模型大模型技术爆发一年多,行业竞争态势激烈而又多变。通义千问走了一条最“卷”的路,2023...……更多
iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑
...从Gemma 2 27B中蒸馏而来。虽然它的参数只有2.6B,但在LMSYS竞技场上的得分,已经超越了GPT-3.5和Mixtral 8x7B!在MMLU和MBPP基准测试中,它分别取得了56.1和36.6的优异成绩;比起前代模型Gemma 1 2B,它的性能超过了10%。小模型击败了大几..……更多
奥林匹克第一课:学会面对成功和失败
...同样需要一颗大心脏来容纳。17岁的奥地利选手沃洛施茨一口气报名了高山滑雪的四个个人小项和一个混合性别项目,这几天的参赛经历堪称“过山车”。她先是在其中一项比赛中获得第14名,随后夺冠,然后又摔倒无缘完赛,...……更多
阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至
...,在权威基准OpenCompass上性能追平GPT-4-Turbo,并在大模型竞技场Chatbot Arena中跻身全球前15。此次降价的力度如此之大,刘伟光表示,这得益于公共云的技术红利和规模效应,带来的巨大成本和性能优势。阿里云从模型和AI基础设施...……更多
to B要挣钱、to C要谨慎,李开复的大模型坚持
10月15日深夜,零一万物的Yi-Lighting大模型在LMSYS盲测竞技场的投票数超过1万次,拿到了这个国际权威测试榜单的入场券,\"出来的结果是,我们排在全球第六\",10月16日上午,零一万物CEO李开复向媒体宣布时一字一顿。为了强调...……更多
更多关于科技的资讯:
新春百吋电视选购指南:认准真百吋,看清真门道
蛇年将至,添新成了头等大事。尤其是准备买大屏电视的朋友,一想到除夕夜里,全家大小用沉浸式巨幕看春晚心情那个爽;亲戚朋友来拜年
2025-01-22 19:03:00
蔚来高管回应进军机器狗:没有的事儿
快科技1月22日消息,此前有消息称,蔚来已组建约20人团队调研机器狗项目,由前Momenta算法专家徐抗负责。对此,蔚来智能驾驶产品与体验负责人向徐抗进行了询问
2025-01-22 20:32:00
1299元 追风者发布Evolv X2系列机箱:三面钢化玻璃
快科技1月22日消息,追风者推出了Evolv X2系列机箱,首发1299元。这款机箱采用了卓越的垂直气流设计,通过底部进气
2025-01-22 20:32:00
比二手还便宜!iPad mini 7 eSIM版叠加国补仅3399元
快科技1月22日消息,近日北京、浙江、湖北、江苏、广东等地已经陆续上线了手机、平板等数码国补,可以叠加在电商等优惠,进一步补贴15%的价格
2025-01-22 21:02:00
便民惠民!2025年以旧换新政策全新升级
十堰广电讯(全媒体记者 何旭 魏俊)近日,记者从十堰市商务部门获悉,今年以旧换新政策继续实施,而且进行了全新升级提档扩围
2025-01-22 21:26:00
《X战警》凤凰女Cos美图欣赏:胶衣完美展示好身材
近日国外美女Coser Lady Melamori在推特上分享了她的《X战警》凤凰女Cos作品,完美还原该角色,并展示了自己的性感好身材
2025-01-22 21:32:00
OPPO Find N3 Flip新春直降800元 还可叠加500元国家补贴
快科技1月22日消息,OPPO宣布旗下小折叠手机Find N3 Flip大促,新春直降800元 还可叠加500元国家补贴
2025-01-22 21:32:00
冷冷冷 多地将冻成“紫色”!今年首场寒潮来袭:大规模雨雪上线
快科技1月22日消息,前段时间我国气温偏高明显,在遇上即将到来的今年首场寒潮后,会带来大幅降温。据中国天气网最新预报,我国大部气温普遍下降8至12℃
2025-01-22 21:32:00
2025全年可领!“一码贵州”上线以旧换新补贴申领通道
1月20日,一码贵州平台上线家电、数码产品、汽车、家居等品类的购新与申领补贴通道,活动将持续至2025年12月31日。活动期间
2025-01-22 21:53:00
车里也能看烟花!小米SU7智能双表盘“小年彩蛋表情”上线
快科技1月22日消息,小米汽车SU7智能双表盘“小年彩蛋表情”正式上线。用户只需语音指令“小爱同学放烟花”,表盘即刻展现烟花效果
2025-01-22 22:32:00
济南公司积极探索短视频营销新路径,通过精心策划和高效运营,短视频品牌效应日益显著,大幅提升了公司的品牌知名度和美誉度。去年11月至今共征集短视频40余个
2025-01-22 22:33:00
浙江在线1月22日讯(通讯员 张超 徐紫琪) 国网舟山供电公司信通分公司于1月19日完成信通数智平台系统级部署工作,平台建设聚焦信通业务数字化升级
2025-01-22 17:18:00
中信恒泰董事长陆霖带队赴广州晟能电子科技有限公司考察交流
近日,中信恒泰董事长陆霖携公司总经理助理、低空经济产业研究院院长黄毅,集团企业技术中心经理、工程数智医院院长张融等技术骨干前往广州晟能电子科技有限公司(以下简称“广州晟能”)考察交流
2025-01-22 17:22:00
亚商投顾:客户至上的理念与技术创新并行
在2024年,证券投资咨询行业经历了多方面的变革和挑战。市场的竞争愈发激烈,投资者的需求日益多元化,尤其是对于专业性、个性化和高效服务的要求逐步提升
2025-01-22 17:30:00
城市领航+代客泊车上车!2025款汉家族正式开启内测用户OTA推送
快科技1月22日消息,日前,比亚迪2025款汉家族的城市领航和代客泊车功能已向首批内测用户推送OTA升级,包含5项新增功能和6项体验优化
2025-01-22 17:31:00