• 我的订阅
  • 科技

阿里云发布通义千问2.5,性能赶超GPT-4 Turbo

类别:科技 发布时间:2024-05-09 12:00:00 来源:锌财经

通义大模型发布一周年之际,迎来重要的历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-70B,成为开源领域最强大模型。

历经一年多追赶,国产大模型终于进入核心竞技场,可与国外一流大模型一较高下。

奋力追赶一年,成就最强中文大模型

大模型技术爆发一年多,行业竞争态势激烈而又多变。通义千问走了一条最“卷”的路,2023年4月问世以来,始终专注于基础模型的技术研发,从初代模型升级至2.5版本。相比此前的通义千问2.1版,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力更是持续领先业界。根据权威基准OpenCompass的测评结果,通义千问2.5得分追平GPT-4 Turbo,是该基准首次录得国产大模型取得如此佳绩。

阿里云发布通义千问2.5,性能赶超GPT-4 Turbo

同时,通义还发布了1100亿参数开源模型Qwen1.5-110B,该模型在MMLU、TheoremQA、GPQA等基准测评中超越Meta的Llama-3-70B,在HuggingFace开源大模型排行榜Open LLM Leaderboard上进入榜首,再度证明通义开源系列业界最强的竞争力。

通义多模态模型和专有能力模型也具备业界顶尖影响力。在多个多模态标准测试中,通义千问视觉理解模型Qwen-VL-Max得分超越Gemini Ultra和GPT-4V,这款模型已在多家企业落地;代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的榜首模型,也是国内用户规模第一的智能编码助手通义灵码的底座。

阿里云发布通义千问2.5,性能赶超GPT-4 Turbo

从曾经的追赶者到如今的并行者,通义大模型频频霸榜,可以说是国产大模型一年来砥砺前行、奋力追赶的缩影。

一年间,通义还发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过API调用、模型下载等方式接入通义,个人用户可从APP、官网和小程序免费使用通义。大会当日,原通义千问APP宣布更名为“通义APP”,将通义大模型全套能力集于一身,致力于成为“通情达义”的全能AI助手。

坚定开源路线,成为中国最强开源大模型

去年8月,通义宣布加入开源行列,随之启动马不停蹄的开源狂飙,沿着“全模态、全尺寸”开源路线陆续推出十多款模型。目前,通义开源模型下载量已经超过700万。

大模型的训练和迭代成本极高,绝大部分的AI开发者和中小企业都无法负担。Meta、阿里云等推动的大模型开源风潮,让开发者不必从头训练模型,还把模型选型的主动权交给了开发者,大大加速了大模型的应用落地进程。

阿里云发布通义千问2.5,性能赶超GPT-4 Turbo

为顺应不同场景用户需求,通义推出参数规模横跨5亿到1100亿的八款大语言模型,小尺寸模型如0.5B、1.8B、4B、7B、14B,可便捷地在手机、PC等端侧设备部署;大尺寸模型如72B、110B能支持企业级和科研级的应用;中等尺寸如32B试图在性能、效率和内存占用之间找到最具性价比的平衡点。此外,通义还开源了视觉理解模型Qwen-VL、音频理解模型Qwen-Audio、代码模型CodeQwen1.5-7B、混合专家模型Qwen1.5-MoE。

通义72B、110B开源模型都曾登顶Open LLM Leaderboard榜首。在开放研究机构LMSYS Org推出的基准测试平台Chatbot Arena上,通义72B模型多次进入“盲测”结果全球Top 10,创造了国产大模型的先例。

阿里云发布通义千问2.5,性能赶超GPT-4 Turbo

长期沉淀的良好口碑为通义开源模型赢得一众铁粉,每有开源动作都会早早被开发者“蹲守”,也总能获得生态伙伴第一时间支持。“开发者的反馈和开源社区的生态支持,是通义大模型技术进步的重要助力。”阿里云CTO周靖人透露,未来通义大模型还会持续开源。

开源开放,打造最受中国企业欢迎的大模型

通义正在成为最受中国企业欢迎的大模型。根据最新数据,通义通过阿里云服务企业超过9万、通过钉钉服务企业超过220万,现已落地PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。

5月9日,小米旗下的人工智能助手“小爱同学”与阿里云通义大模型达成合作,强化其在图片生成、图片理解等方面的多模态 AI 生成能力,并在小米汽车、手机等多类设备落地;微博、众安保险、完美世界游戏等企业也宣布接入通义大模型,将大模型应用于社交媒体、保险、游戏等领域。

阿里云发布通义千问2.5,性能赶超GPT-4 Turbo

此前,通义大模型还曾“上天入地”服务客户,中国科学院国家天文台人工智能组基于通义千问开发了新一代天文大模型“星语3.0”,这是大模型首次应用于天文观测领域;陕煤建新煤矿等十余座矿山推出由通义支持的新型矿山重大风险识别处置系统,成为大模型在矿山场景的首次规模化落地。

一直以来,阿里云都强调要成为“AI时代最开放的云”,通过开放的算力平台、开源的自研模型、优质的模型服务,帮助客户抓住大模型时代的机遇。如今,开源开放战略正为阿里云带来新的商业增长。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-09 15:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

阿里云正式发布通义千问2.5,阿里云方面表示,通义千问2.5模型性能全面赶超GPT-4Turbo。同时,通义千问最新开源的1100亿参数模型在多个基准测评中收获最佳成绩
2024-05-09 11:39:00
阿里最新开源推理模型发布:性能比肩DeepSeek-R1
阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。3月6日凌晨,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B
2025-03-06 13:22:00
Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏
?Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏快科技6月7日消息,Intel官方宣布,旗下数据中心、客户端
2024-07-18 14:57:00
阿里云重磅升级全栈AI体系,一文看懂云栖大会技术发布
...阿里云智能首席技术官周靖人发布了多项重磅技术更新。通义大模型7连发,在模型智能水平、Agent工具调用和Coding能力、深度推理、多模态等方面实现多项突破。2025云栖大会
2025-09-24 13:30:00
阿里云CTO周靖人:全面投入升级AI大基建
...每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎来了年度重磅发布,基础模型升级,性能媲美GPT-4o,发布最强开源模型Qwen2.5系列,同时上架语言、音频、
2024-09-19 15:53:00
通义千问 再次“激活”阿里云
...勇,在阿里云峰会上正式发布了阿里的大语言模型工具「通义千问」,并宣布旗下阿里「全家桶」全部接入其中。发布会之前,通义千问的「鸟鸟」视频已经流传于社交媒体,而对于阿里来说,能娱
2023-04-14 10:49:00
上线仅7天!阿里通义千问3强势登顶全球开源模型宝座
...评榜LiveBench公布了最新一期排名,阿里巴巴开源的新一代通义千问模型Qwen3(简称“千问3”)斩获全球开源模型冠军
2025-05-06 16:09:00
阿里云CTO周靖人:中国模型界差距在缩小,此次人工智能技术浪潮才刚开始
出品|搜狐科技作者|汉雨棣10月31日云栖大会上,作为通义大模型基础模型的通义千问2.0千亿参数模型正式发布。与此同时,用户开始可以下载通义千问App进行体验。据了解,在10个权
2023-11-01 23:02:00
阿里发布全球最强开源模型千问3 通义App第一时间已上线
快科技4月29日消息,阿里新一代通义千问开源模型Qwen3(简称千问3),现已在通义App与通义网页版(tongyi.com)全面上线
2025-04-29 11:35:00
更多关于科技的资讯:
合肥新视野|东超科技:以无介质成像技术联结科技与生活新场景
大皖新闻讯 无需触碰实体屏幕,仅在空中动动手指就能完成挂号操作——这宛如科幻电影的场景,在安徽省东超科技有限公司(以下简称“东超科技”)的展厅内已成为现实
2025-12-09 21:39:00
越见企业家|卓谊生物让安全“看得见” 一支疫苗的承诺
二十年前,一位南方企业家踏上黑土地;二十年后,他手中的一支疫苗,凝结着南北融合的智慧,更承载着对生命安全的极致承诺。在2025长春健康产业博览会上
2025-12-09 16:55:00
不少家长对儿童电话手表“又爱又恨”。爱的是其定位、通话功能能让家长随时掌握孩子动态、保持联系;恨的是它功能日渐繁杂,从“安全工具”沦为“社交神器”
2025-12-09 16:59:00
技术赋能与文化活化双轮驱动— 沉浸式交互动漫人工智能创作高研班精彩不断
当数字技术遇上传统文化,会碰撞出怎样的创作火花?截至11月30日,国家艺术基金2025年度资助的“沉浸式交互动漫人工智能创作高级人才培养”项目
2025-12-09 12:34:00
以创新叩响未来之门:“凯叔讲故事”荣获第五届未来视听创新大赛优秀奖
以创新叩响未来之门:“凯叔讲故事”荣获第五届未来视听创新大赛优秀奖近日,第五届未来视听创新大赛获奖名单在京正式揭晓。在这场由国家广播电视总局
2025-12-09 13:04:00
科技创新铸就发展引擎 东风汽车自主动力技术再攀新高峰
2025年岁末,中国汽车产业科技创新版图再添浓墨重彩的一笔。12月8日,东风汽车自研全新马赫1.5T混动发动机凭借48
2025-12-09 13:34:00
乌江榨菜登顶山姆“双榜第一”,终端销售额突破千万元大关
近日,『乌江x山姆』双拼组合装乌江爽脆涪陵榨菜在山姆会员商店交出亮眼成绩单。这款10月22日在全国上市的新品,仅用一个月时间便荣登山姆会员店新品热度榜TOP1与酱菜类热度榜TOP1
2025-12-09 13:34:00
聚焦健博会|17 项专利加持!长春本土 “康复黑科技”设备 “走进寻常百姓家”
9日,在2025长春国际医药健康产业博览会现场,展厅内人流如织,聚焦“医学、医药、医疗、医养”的展馆内,带来智能康复设备的吉林省微渺医疗科技有限公司
2025-12-09 13:47:00
租赁市场价格“退烧” 租个人形机器人从每天两万元降至数千元
人形机器人在活动现场“上岗”。 (受访者 供图)人形机器人在展会现场“接待”。(厦门日报记者 杨霞瑜 摄) 厦门网讯 (厦门日报记者 杨霞瑜)有机器人在学校运动会上岗当纪律员
2025-12-09 08:57:00
钉钉安全护航:祝贺“国产GPU第一股”摩尔线程成功上市
12月5日,钉钉客户摩尔线程智能科技(北京)股份有限公司(以下简称“摩尔线程”)正式在上海证券交易所科创板挂牌上市,成为“国产GPU第一股”
2025-12-09 09:53:00
RGB-MiniLED 电视哪款值得入手?重点关注这几点
面对市场上各式各样的RGB-MiniLED电视,如何挑选一台真正适合自己、能提升生活品质的型号?如果你正在纠结“哪款值得入手”
2025-12-09 10:05:00
RGB-MiniLED 电视选哪款?一文读懂RGB-MiniLED为何成为高端首选
当电视行业步入以RGB-MiniLED为关键词的高画质竞赛,甄别技术的真伪与深度成为选购第一步。真正的RGB-MiniLED
2025-12-09 10:01:00
炎黄盈动重磅发布企业级AI平台,全面加速企业AI价值落地
随着AI技术的飞速发展,企业正面临从技术试点到全面应用的关键转折点。技术加速:Gartner报告显示,当前AI智能体和AI就绪型数据发展最快
2025-12-08 11:12:00
路边放一台南迪售货机,打造全时段消费新主张
还在为寻找稳定、低风险的增收渠道而烦恼吗?将一台南迪自动售货机放置在路边,它不仅是24小时不休的“金牌销售”,更是能创造被动收入的坚实资产
2025-12-08 13:35:00
人人租亮相2025中国企业家博鳌论坛平行论坛-创新探索、生态共筑
十年博鳌潮海阔,百舸争流共进发。12月2日至5日,2025企业家博鳌论坛系列活动在海南博鳌举办。围绕“链接全球,引领未来
2025-12-08 13:39:00