• 我的订阅
  • 科技

阿里云发布通义千问2.5,性能赶超GPT-4 Turbo

类别:科技 发布时间:2024-05-09 12:00:00 来源:锌财经

通义大模型发布一周年之际,迎来重要的历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-70B,成为开源领域最强大模型。

历经一年多追赶,国产大模型终于进入核心竞技场,可与国外一流大模型一较高下。

奋力追赶一年,成就最强中文大模型

大模型技术爆发一年多,行业竞争态势激烈而又多变。通义千问走了一条最“卷”的路,2023年4月问世以来,始终专注于基础模型的技术研发,从初代模型升级至2.5版本。相比此前的通义千问2.1版,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力更是持续领先业界。根据权威基准OpenCompass的测评结果,通义千问2.5得分追平GPT-4 Turbo,是该基准首次录得国产大模型取得如此佳绩。

阿里云发布通义千问2.5,性能赶超GPT-4 Turbo

同时,通义还发布了1100亿参数开源模型Qwen1.5-110B,该模型在MMLU、TheoremQA、GPQA等基准测评中超越Meta的Llama-3-70B,在HuggingFace开源大模型排行榜Open LLM Leaderboard上进入榜首,再度证明通义开源系列业界最强的竞争力。

通义多模态模型和专有能力模型也具备业界顶尖影响力。在多个多模态标准测试中,通义千问视觉理解模型Qwen-VL-Max得分超越Gemini Ultra和GPT-4V,这款模型已在多家企业落地;代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的榜首模型,也是国内用户规模第一的智能编码助手通义灵码的底座。

阿里云发布通义千问2.5,性能赶超GPT-4 Turbo

从曾经的追赶者到如今的并行者,通义大模型频频霸榜,可以说是国产大模型一年来砥砺前行、奋力追赶的缩影。

一年间,通义还发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过API调用、模型下载等方式接入通义,个人用户可从APP、官网和小程序免费使用通义。大会当日,原通义千问APP宣布更名为“通义APP”,将通义大模型全套能力集于一身,致力于成为“通情达义”的全能AI助手。

坚定开源路线,成为中国最强开源大模型

去年8月,通义宣布加入开源行列,随之启动马不停蹄的开源狂飙,沿着“全模态、全尺寸”开源路线陆续推出十多款模型。目前,通义开源模型下载量已经超过700万。

大模型的训练和迭代成本极高,绝大部分的AI开发者和中小企业都无法负担。Meta、阿里云等推动的大模型开源风潮,让开发者不必从头训练模型,还把模型选型的主动权交给了开发者,大大加速了大模型的应用落地进程。

阿里云发布通义千问2.5,性能赶超GPT-4 Turbo

为顺应不同场景用户需求,通义推出参数规模横跨5亿到1100亿的八款大语言模型,小尺寸模型如0.5B、1.8B、4B、7B、14B,可便捷地在手机、PC等端侧设备部署;大尺寸模型如72B、110B能支持企业级和科研级的应用;中等尺寸如32B试图在性能、效率和内存占用之间找到最具性价比的平衡点。此外,通义还开源了视觉理解模型Qwen-VL、音频理解模型Qwen-Audio、代码模型CodeQwen1.5-7B、混合专家模型Qwen1.5-MoE。

通义72B、110B开源模型都曾登顶Open LLM Leaderboard榜首。在开放研究机构LMSYS Org推出的基准测试平台Chatbot Arena上,通义72B模型多次进入“盲测”结果全球Top 10,创造了国产大模型的先例。

阿里云发布通义千问2.5,性能赶超GPT-4 Turbo

长期沉淀的良好口碑为通义开源模型赢得一众铁粉,每有开源动作都会早早被开发者“蹲守”,也总能获得生态伙伴第一时间支持。“开发者的反馈和开源社区的生态支持,是通义大模型技术进步的重要助力。”阿里云CTO周靖人透露,未来通义大模型还会持续开源。

开源开放,打造最受中国企业欢迎的大模型

通义正在成为最受中国企业欢迎的大模型。根据最新数据,通义通过阿里云服务企业超过9万、通过钉钉服务企业超过220万,现已落地PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。

5月9日,小米旗下的人工智能助手“小爱同学”与阿里云通义大模型达成合作,强化其在图片生成、图片理解等方面的多模态 AI 生成能力,并在小米汽车、手机等多类设备落地;微博、众安保险、完美世界游戏等企业也宣布接入通义大模型,将大模型应用于社交媒体、保险、游戏等领域。

阿里云发布通义千问2.5,性能赶超GPT-4 Turbo

此前,通义大模型还曾“上天入地”服务客户,中国科学院国家天文台人工智能组基于通义千问开发了新一代天文大模型“星语3.0”,这是大模型首次应用于天文观测领域;陕煤建新煤矿等十余座矿山推出由通义支持的新型矿山重大风险识别处置系统,成为大模型在矿山场景的首次规模化落地。

一直以来,阿里云都强调要成为“AI时代最开放的云”,通过开放的算力平台、开源的自研模型、优质的模型服务,帮助客户抓住大模型时代的机遇。如今,开源开放战略正为阿里云带来新的商业增长。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-09 15:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

阿里云正式发布通义千问2.5,阿里云方面表示,通义千问2.5模型性能全面赶超GPT-4Turbo。同时,通义千问最新开源的1100亿参数模型在多个基准测评中收获最佳成绩
2024-05-09 11:39:00
阿里最新开源推理模型发布:性能比肩DeepSeek-R1
阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。3月6日凌晨,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B
2025-03-06 13:22:00
Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏
?Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏快科技6月7日消息,Intel官方宣布,旗下数据中心、客户端
2024-07-18 14:57:00
阿里云CTO周靖人:全面投入升级AI大基建
...每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎来了年度重磅发布,基础模型升级,性能媲美GPT-4o,发布最强开源模型Qwen2.5系列,同时上架语言、音频、
2024-09-19 15:53:00
通义千问 再次“激活”阿里云
...勇,在阿里云峰会上正式发布了阿里的大语言模型工具「通义千问」,并宣布旗下阿里「全家桶」全部接入其中。发布会之前,通义千问的「鸟鸟」视频已经流传于社交媒体,而对于阿里来说,能娱
2023-04-14 10:49:00
上线仅7天!阿里通义千问3强势登顶全球开源模型宝座
...评榜LiveBench公布了最新一期排名,阿里巴巴开源的新一代通义千问模型Qwen3(简称“千问3”)斩获全球开源模型冠军
2025-05-06 16:09:00
阿里云CTO周靖人:中国模型界差距在缩小,此次人工智能技术浪潮才刚开始
出品|搜狐科技作者|汉雨棣10月31日云栖大会上,作为通义大模型基础模型的通义千问2.0千亿参数模型正式发布。与此同时,用户开始可以下载通义千问App进行体验。据了解,在10个权
2023-11-01 23:02:00
阿里发布全球最强开源模型千问3 通义App第一时间已上线
快科技4月29日消息,阿里新一代通义千问开源模型Qwen3(简称千问3),现已在通义App与通义网页版(tongyi.com)全面上线
2025-04-29 11:35:00
阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至
5月21日,阿里云抛出重磅炸弹:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0
2024-05-22 16:18:00
更多关于科技的资讯:
南京六家企业入选国家级5G工厂江宁开发区企业占据“半壁江山”南报网讯(通讯员毛欣悦记者张希)近日,工信部对《2025年5G工厂名录》进行公示
2025-09-02 07:36:00
烟台联通全力保障2025秋季开学通信畅通
胶东在线8月29日讯随着2025年秋季开学季的到来,烟台各大高校陆续迎来返校师生。为保障新学期校园网络高效稳定运行,烟台联通充分利用暑假关键窗口期
2025-09-02 05:00:00
科大讯飞亮相2025未来外贸大会,AI翻译成破局外贸新蓝海关键引擎
8月26日,2025未来外贸大会在广州白云国际会议中心顺利举行,大会主题为“本地账户链全球,共拓外贸新蓝海”。本次大会由中国B2B外贸金融平台XTransfer主办
2025-09-01 11:12:00
聚焦数博会丨丰浩建设科技:引领建筑行业数字化变革
2025中国国际大数据产业博览会吸引了全球目光,来自江苏常州的江苏丰浩建设科技有限公司作为建筑科技领域的创新先锋,携前沿技术与创新成果精彩亮相
2025-09-01 11:37:00
今年以来,广东南粤银行中山分行积极响应国家科技自立自强战略部署,深度融入区域科技创新生态建设,以科技金融为重要抓手,持续优化服务模式
2025-09-01 14:14:00
华为XMAGE“共见·安吉”:持续推动移动影像技术突破与美学共鸣
8月29日至31日,华为XMAGE“共见·安吉”影像主题活动在浙江安吉举办,华为研发专家与全球专业摄影师围绕移动影像技术发展与创作实践展开深度交流
2025-09-01 14:14:00
不止玫瑰与黄金 七夕\
消费日报网讯(记者马佳丽)今年七夕节,消费市场热度依旧,不仅各类商品成交量显著增长,更反映出人们在情感表达上的多元化与升级趋势
2025-09-01 15:18:00
第六代市场未开先火,铺火,支付更火
在义乌,一场激烈的 “战争” 正在悄然上演。义乌第六代市场核心项目全球数贸中心迎来招商热潮,自 6 月起分批启动的招投标阶段
2025-09-01 15:23:00
2025年以来,中国光大银行坚持以客户为中心,将数字技术深度融入业务创新与运营,聚焦“光大云缴费”、手机银行、“薪悦通”等平台
2025-09-01 15:27:00
ICML 2025收录作业帮成果:大模型能量基偏好模型领跑教育适配
日前,第42届国际机器学习大会(ICML 2025)在加拿大温哥华会议中心盛大举行,基于在前沿技术领域的多年探索与深耕
2025-09-01 15:33:00
榆树炸鸡腿与美团达成战略合作,携手赋能数字化升级
近日,知名中式炸鸡品牌榆树炸鸡腿与生活服务领域巨头美团正式签署战略合作协议。双方宣布将围绕物联网应用、大数据分析、企业规范化管理及外卖业务优化等核心领域展开深度融合
2025-09-01 15:33:00
老用户直呼上当!导购平台返利网被指“私设”百元提现门槛 官方回应:用于维护补贴的可持续性
消费日报网讯(记者 王鑫坤)近期,有许多消费者投诉称,在使用导购平台返利网APP的过程中发现平台“私设”了百元提现门槛
2025-09-01 15:49:00
灌云农商银行:“金心为你,爱在七夕”贵金属展销会落幕
为满足广大消费者对贵金属的投资、收藏与馈赠需求,值七夕佳节之际,一场盛大的“金心为你,爱在七夕”贵金属展销会于2025年8月29日在灌云农商银行城西支行二楼举办
2025-09-01 15:50:00
向内生长,方能远行:青岛女创会与文运心塾共修“大学之道”
大众网记者 石尚峰 青岛报道海风伴经典,智慧照初心。8月30日,青岛市女性创业者协会携手文运心塾,邀请文运先生携新书《开启生命成长之路——今用十讲》亲临授课
2025-09-01 17:05:00
人工智能背景下创业人才的需求变化和培养模式
文丨薛晶心 曾珍 天津外国语大学国际商学院人工智能作为催动科技革命和产业变革的核心驱动力量,正深刻改变着全球产业格局与就业市场
2025-09-01 17:20:00