• 我的订阅
  • 科技

遥遥领先!阿里Qwen-2成全球开源大模型排行榜第一

类别:科技 发布时间:2024-06-27 11:53:00 来源:浅语科技

快科技6月27日消息,全球知名的开源平台Hugging Face的联合创始人兼首席执行官Clem在社交平台激动宣布,阿里巴巴最新开源的Qwen2-72B指令微调版本在开源模型排行榜上荣登榜首。

为了打造一个更为公正和准确的开源大模型排名,Clem及其团队利用300块H100高性能硬件,对全球100多个主流开源大模型,包括Qwen2、Llama-3、Mixtral、Phi-3等,在BBH、MUSR、MMLU-PRO、GPQA等严格的基准测试集上进行了全面而深入的评估。

这次重新评估的初衷在于,许多开发者过于追求排行榜的名次,导致在模型训练过程中过度依赖评估集数据,并且过去的评估标准对于模型而言显得过于简单。因此,本次评估提高了难度标准,以检验这些模型在更高挑战下的真实性能。

令人瞩目的是,阿里巴巴开源的Qwen-2 72B模型在激烈竞争中脱颖而出,不仅超越了科技巨头Meta的Llama-3,还超越了法国知名大模型平台Mistralai的Mixtral,成为了新的行业领军者。这一成绩充分展示了中国在全球开源大模型领域的领导地位。

针对这一排名结果,Stability AI的研究总监、早年在19岁便获得博士学位的Tanishq表示,他早前就预测中国在开源大模型领域具有强大的竞争力。除了Qwen2,还有零一万物、InternLM、Deepsseek等众多优秀的中国开源模型,都在国际舞台上崭露头角。

Tanishq进一步强调,任何关于中国在开源大模型领域落后的观点都是站不住脚的。相反,中国在这一领域正逐渐展现出领导者的姿态,引领着全球开源模型的发展潮流。

遥遥领先!阿里Qwen-2成全球开源大模型排行榜第一

【本文结束】如需转载请务必注明出处:快科技

责任编辑:鹿角

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-27 15:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...门槛体验全球领先的AI能力。据2025年1月AIGC RANK中国AI应用排行榜,夸克平均日活3369万,位列中国AI应用第一
2025-03-13 12:00:00
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...A等基准测评中超越Meta的Llama-3-70B,在HuggingFace开源大模型排行榜Open LLM Leaderboard上进入榜首
2024-05-09 12:00:00
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...pretrained)(预训练大语言模型)和中文大模型榜单C-Eval排行榜已经爬升到1位。上下文窗口,意味着模型的“记忆力”
2023-11-06 12:13:00
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
...初,Meta开源最新的LLaMA-4模型,随后快速冲上Chatbot Arena 排行榜第二,仅次于Google刚发布的 Gemini 2
2025-04-29 16:17:00
吴泳铭为阿里云带来了什么?
...评中超越 Meta 的 Llama-3-70B,并登上 HuggingFace 开源大模型排行榜首,已在全球开源模型中处于顶尖水平
2024-05-21 18:10:00
阿里云PolarDB登顶全球数据库性能及性价比排行榜
...大会上,阿里云宣布PolarDB登顶全球数据库性能及性价比排行榜。根据国际数据库事务处理性能委员会(TPC,Transaction Processing Performance Council)官网披露
2025-02-26 14:09:00
国内首个官方“大模型标准符合性评测”公布
...型,通义千问72B号称自12月1日开源后,先后登顶HuggingFace排行榜、上海人工智能实验室OpenCompass榜单
2023-12-23 15:09:00
腾讯推出新一代快思考模型混元 Turbo S,将在腾讯元宝逐步灰度上线
...首个AI原生App元宝超越豆包,升至中国区苹果免费APP下载排行榜第二。DeepSeek继续位居榜首。2025年以来
2025-02-27 19:52:00
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...多大尺寸模型。 HuggingFaceOpenLLMLeaderboard(pretrained)大模型排行榜,Yi-34B高居榜首(2023年11月5日)在C-Eval中文权威榜单排行榜上
2023-11-06 15:25:00
更多关于科技的资讯:
南报网讯(通讯员毛欣悦记者张希)近日,2025年度南京市新核定的外资研发中心名单公布,江宁开发区5家外资研发中心核定入选
2025-08-25 07:38:00
从清北退学的年轻人,当月入五千的CEO
与其浪费时间,不如直接退学还有一年就要从北大医学院毕业的大三学生阿布,决定从北大退学了。阿布提交了退学申请后,学校的老师并没有立刻批准
2025-08-24 19:17:00
京东建材超品日全渠道大幅增长 卫浴、灯饰照明品类成交额增长超7倍
8月20日晚8点开启的京东建材超级品类日,掀起了今秋第一场家装消费热潮。开售仅1小时,全品类成交额同比增长超2倍;截至8月21日23:59
2025-08-24 20:52:00
烈日炎炎!防晒美白需注意哪些关键因素?近日,护肤品牌谷雨研发负责人李安章从专业角度支招,向中新经纬产业一线栏目讲述防晒美白背后的研发与创新。来源:中新经纬编辑:熊思怡广告等商务合
2025-08-24 17:25:00
能感知环境,还能响应用户需求!全球首款人形机器人头部模组在贵安新区诞生
日前,贵安新区威迈尔科技有限公司(以下简称:威迈尔)正式推出全球首款人形机器人头部模组OmniHead(奥视知脑),为具身智能领域带来关键技术突破
2025-08-24 22:22:00
流量经济赋能长春农博会成果显著,线上销售额突破5200万元
第24届中国长春国际农业食品博览(交易)会胜利闭幕,在为期十天的展会上,流量经济赋能专区成为亮点。通过多平台联动、达人矩阵直播
2025-08-24 21:36:00
“车BA” 南京争霸
8月23日,“车BA”小米集团汽车部跨区域篮球争霸赛决赛在南京举行,来自北京、上海、武汉等地的7支参赛队伍齐聚古都南京,角逐冠军。 南京日报/紫金山新闻记者 段仁虎 摄
2025-08-24 09:50:00
“关不掉”的免密支付,肥了平台的钱包?
原标题| “关不掉”的免密支付,肥了平台的钱包?近日,话题“一定要关闭免密支付和自动扣款”冲上社交平台热搜,关于免密支付功能相关的讨论再次进入大众视野
2025-08-24 05:43:00
美国医疗巨头瞄准聚焦超声无创治疗赛道
近日,由美国医疗巨头强生等十余家机构组成财团,以22.5亿美元(约人民币161亿元)闪电收购了一家专注于“无创”超声波组织碎化技术(Histotripsy)的美国医疗科技公司HistoSonics多数股权
2025-08-24 07:02:00
家电业均价下滑!三翼鸟上海体验中心九成用户选高端
中国家电市场正经历均价下行的趋势。奥维云网数据显示,2025年第1周到第11周,空调、冰箱、洗衣机线上渠道均价同比分别下滑3
2025-08-23 08:20:00
在意大利:海尔空调销量TOP1
今夏,欧洲人经历了严酷“烤”验。八月初,受罕见热浪侵袭,意大利、法国等多国发布高温红色预警,西班牙南部气候飙升至46℃
2025-08-23 08:21:00
2025年,中国新材料产业总产值预计突破10万亿元,但在被列为“卡脖子”的多项关键材料中,国产化率不足30%。铝,作为全球产量第一
2025-08-23 08:22:00
单店年入过亿!三翼鸟上海体验中心是如何做到的?
当前,实体零售业正面临着变革与挑战,一方面,线上浪潮带来的冲击清晰可见:传统卖场客流锐减、部分门店面临关停挑战,《2025到店零售3
2025-08-23 08:22:00
省心比省钱重要!三翼鸟上海体验中心8成用户定制场景
当前,消费者在居家领域的决策逻辑正经历深刻变革。过往,性价比常是左右消费者选购家电、家居产品的核心要素,而如今,“省心”已逐渐攀升至决策考量的优先位置
2025-08-23 08:23:00
8月23日19:00,“河北五超”承德vs保定,最硬核的主场,承德“硬核宠粉”现场抽奖送钻石!
2025-08-23 08:53:00