• 我的订阅
  • 科技

遥遥领先!阿里Qwen-2成全球开源大模型排行榜第一

类别:科技 发布时间:2024-06-27 11:53:00 来源:浅语科技

快科技6月27日消息,全球知名的开源平台Hugging Face的联合创始人兼首席执行官Clem在社交平台激动宣布,阿里巴巴最新开源的Qwen2-72B指令微调版本在开源模型排行榜上荣登榜首。

为了打造一个更为公正和准确的开源大模型排名,Clem及其团队利用300块H100高性能硬件,对全球100多个主流开源大模型,包括Qwen2、Llama-3、Mixtral、Phi-3等,在BBH、MUSR、MMLU-PRO、GPQA等严格的基准测试集上进行了全面而深入的评估。

这次重新评估的初衷在于,许多开发者过于追求排行榜的名次,导致在模型训练过程中过度依赖评估集数据,并且过去的评估标准对于模型而言显得过于简单。因此,本次评估提高了难度标准,以检验这些模型在更高挑战下的真实性能。

令人瞩目的是,阿里巴巴开源的Qwen-2 72B模型在激烈竞争中脱颖而出,不仅超越了科技巨头Meta的Llama-3,还超越了法国知名大模型平台Mistralai的Mixtral,成为了新的行业领军者。这一成绩充分展示了中国在全球开源大模型领域的领导地位。

针对这一排名结果,Stability AI的研究总监、早年在19岁便获得博士学位的Tanishq表示,他早前就预测中国在开源大模型领域具有强大的竞争力。除了Qwen2,还有零一万物、InternLM、Deepsseek等众多优秀的中国开源模型,都在国际舞台上崭露头角。

Tanishq进一步强调,任何关于中国在开源大模型领域落后的观点都是站不住脚的。相反,中国在这一领域正逐渐展现出领导者的姿态,引领着全球开源模型的发展潮流。

遥遥领先!阿里Qwen-2成全球开源大模型排行榜第一

【本文结束】如需转载请务必注明出处:快科技

责任编辑:鹿角

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-27 15:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...门槛体验全球领先的AI能力。据2025年1月AIGC RANK中国AI应用排行榜,夸克平均日活3369万,位列中国AI应用第一
2025-03-13 12:00:00
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...A等基准测评中超越Meta的Llama-3-70B,在HuggingFace开源大模型排行榜Open LLM Leaderboard上进入榜首
2024-05-09 12:00:00
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...pretrained)(预训练大语言模型)和中文大模型榜单C-Eval排行榜已经爬升到1位。上下文窗口,意味着模型的“记忆力”
2023-11-06 12:13:00
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
...初,Meta开源最新的LLaMA-4模型,随后快速冲上Chatbot Arena 排行榜第二,仅次于Google刚发布的 Gemini 2
2025-04-29 16:17:00
吴泳铭为阿里云带来了什么?
...评中超越 Meta 的 Llama-3-70B,并登上 HuggingFace 开源大模型排行榜首,已在全球开源模型中处于顶尖水平
2024-05-21 18:10:00
阿里云重磅升级全栈AI体系,一文看懂云栖大会技术发布
...t)和推理(Thinking)两大版本,其预览版已在 Chatbot Arena 排行榜上位列第三,正式版性能可望再度实现突破
2025-09-24 13:30:00
阿里云PolarDB登顶全球数据库性能及性价比排行榜
...大会上,阿里云宣布PolarDB登顶全球数据库性能及性价比排行榜。根据国际数据库事务处理性能委员会(TPC,Transaction Processing Performance Council)官网披露
2025-02-26 14:09:00
国内首个官方“大模型标准符合性评测”公布
...型,通义千问72B号称自12月1日开源后,先后登顶HuggingFace排行榜、上海人工智能实验室OpenCompass榜单
2023-12-23 15:09:00
腾讯推出新一代快思考模型混元 Turbo S,将在腾讯元宝逐步灰度上线
...首个AI原生App元宝超越豆包,升至中国区苹果免费APP下载排行榜第二。DeepSeek继续位居榜首。2025年以来
2025-02-27 19:52:00
更多关于科技的资讯:
中新经纬1月15日电 据“深圳市消费者委员会”微信号消息,近期,深圳市消委会开展儿童洞洞鞋比较试验,从线上、线下随机购买15款样品
2026-01-15 21:00:00
做完近视手术后,到底能不能看手机、电脑?划重点:可以看,但要讲“时机”和“方法”,盲目用眼可能会影响恢复哦!首先要明白
2026-01-15 22:13:00
依托自主研发的金融科技平台与线上化系统支撑,昆山农商银行成功推出“贵金属线上业务”及专属财富管理小程序,突破传统贵金属业务的地域与时间限制
2026-01-15 22:40:00
最高补贴1500元!家电、数码全都有,这份“省钱指南”请收好
大河网讯 近日,郑州航空港区正式启动2026年消费品以旧换新补贴活动,覆盖汽车、家电、数码智能产品三大领域,通过真金白银的补贴
2026-01-15 21:17:00
消费选择的力量:OATLY携手各界伙伴共建可持续生态
作为全球前沿和领先的燕麦奶公司,OATLY在创立30多年的时间里,始终倡导健康与可持续的生活理念,持续开发优质燕麦产品
2026-01-15 21:29:00
赋能卓展新材料产业链升级,万事达以一体化方案打造高标准智造厂房
在制造业高质量发展的背景下,高标准工业空间成为企业提升竞争力的关键。近日,万事达集团(以下简称“万事达”)与山东卓展新材料有限公司(以下简称“卓展新材料”)正式达成合作
2026-01-15 21:29:00
国产热成像品牌实力榜解析
曾几何时,红外热成像江湖是FLIR、雷神等海外巨擘的专属领地,技术壁垒与市场垄断如同铜墙铁壁。但如今,国产力量强势崛起
2026-01-15 17:21:00
智启创业新篇 共筑产业高地——2026年青岛市AI创业生态大会举办 单人AI创业家(OPIE)平台同步上线
鲁网1月15日讯(记者 薛同春 通讯员 赵红)1月15日,2026年青岛市AI创业生态大会暨单人AI创业家(OPIE)平台上线发布会在青岛国际会议中心隆重举行
2026-01-15 17:22:00
当一场场标榜“山姆线上直播”“无需会员费”“全国配送”的带货狂欢在网络直播间轮番上演时,消费的便捷似乎触手可及。然而,喧嚣背后隐藏着另一重真相
2026-01-15 17:58:00
在智能化浪潮席卷各行业的今天,如何正确理解并应用人工智能,成为转型的关键。针对这一热点话题,贵州省人工智能机器视觉产研中心算法专家
2026-01-15 18:34:00
海外网1月15日电 据美国《新闻周刊》网站报道,由于销售状况不佳和债务情况恶化,美国高端百货零售企业萨克斯环球于当地时间14日宣布申请破产
2026-01-15 19:39:00
纵览名师讲堂 | 关注中考动向,聚焦高频考点一尺规作图与图形剪拼解题策略
石家庄市第九中学齐迎霞老师主讲中考数学高频考点——尺规作图与图形剪拼解题策略
2026-01-15 16:19:00
纵览原创|盒马指数171远超一线城市均值!石家庄新零售火爆的背后
记者 李春炜1月13日傍晚六点半,石家庄勒泰中心负一层的盒马鲜生门店内,选购新鲜果蔬、烘焙点心的顾客络绎不绝,收银台前排起长队
2026-01-15 16:21:00
海尔巴基斯坦发布冰箱新品 夯实高端引领地位
当地时间1月8日,海尔巴基斯坦经销商峰会在拉合尔成功举办。会上,海尔冰箱正式推出27款全系彩屏变频新品,包括Vista风冷系列以及全面升级的TM660系列
2026-01-15 16:13:00