• 我的订阅
  • 科技

通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型

类别:科技 发布时间:2023-12-01 21:07:00 来源:36氪

时隔一个月,通义千问又放大招了!

在一个月前的阿里云栖大会上,阿里正式发布通义千问2.0版本,在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上,都有较大提升。并且,阿里云还发布了包括编程、AI阅读、音视频转录、AI角色生成等八大产品模型。

当时,阿里云就已经预告,接下来还要再发更大规模的开源模型。

12月1日,三款新模型如约而至——包括Qwen-72B、Qwen-1.8B和Qwen-Audio大模型,通义千问大模型也升级到了2.1版本。

最受瞩目的首先是Qwen-72B,参数达到720亿,基于3T tokens的高质量数据训练。阿里云表示,Qwen-72B在10个权威基准测评中夺得开源模型最优成绩,在部分测评中超越闭源的GPT-3.5和GPT-4。

通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型

△来源:阿里云

具体来说,在英语任务上,Qwen-72B在MMLU基准测试取得开源模型最高分;中文任务上,Qwen-72B在C-Eval、CMMLU、GaokaoBench等基准得分超越GPT-4。

而在数学推理方面,Qwen-72B在GSM8K、MATH测评中也领先其他开源模型;代码理解方面,Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升,代码能力也有质的飞跃。

通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型

△72B模型做数学题

在复杂语义理解上,72B的能力也提高了不少,比如,现在就能够听懂中文里的“潜台词”了:

通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型

△72B模型理解“职场之道”

当前,国内外大模型都分为闭源和开源两大路线。对标国外——OpenAI已走闭源路线,开源模型的代表则是Meta旗下的Llama。Meta在今年7月发布了Llama 2,分别有7B(70亿参数)、13B(130亿参数)和70B(700亿参数)三个尺寸。

阿里云Qwen-72B的推出,也意味着国内市场又多了一个对标Llama 2-70B的头部开源模型。当前,通义千问的大语言模型家族已经实现全尺寸开源——包括18亿、70亿、140亿、720亿7个参数。

不同规模和尺寸的模型,意味着应用场景可以拓宽更多。比如,高达720亿参数的Qwen-70B推出后,大中型企业就可以基于此可开发商业应用,高校、科研院所可利用AI来辅助科研工作——这些工作都需要复杂的运算,也依赖于模型能力边界的不断拓展。

阿里云在会上也请了不少开发者、企业介绍已有的模型实践。比如华东理工大学的X-D Lab,及基于基于开源的通义千问开源模型开发了心理健康大模型MindChat(漫谈)、医疗健康大模型Sunsimiao(孙思邈)、教育/考试大模型GradChat(锦鲤)等,并为下游客户开发基于行业大模型的产品。

目前,已经有已有超过20万人次用过上述的大模型,X-D Lab已经累计提供了超过100万次的问答服务。

“当我们用同样的方法,把同样规模的数据应用到各个开源模型,Qwen的效果比其他模型好得多。”华东理工大学·X-DLab(心动实验室)成员颜鑫表示,团队只用20万tokens的数据微调了Qwen基座模型,就获得了比另一家用百万级数据微调的模型更好的效果。

阿里云还发布了一款参数量更小的大模型——Qwen-1.8B。这是一款专为端侧设计的模型,推理2K长度文本内容仅需3G显存,可跑在消费级终端上——比如手机、电脑等。

如今算力紧缺,大模型的训练和推理成本都居高不下,超大规模参数的大模型只能在云上部署。为了能让大模型可以跑在更多终端上,近期包括大模型、手机、电脑等厂商都在探索更小尺寸规模的模型。

最直接的效果就是,1.8B体量的大模型,就能离线在手机、电脑等终端上运行。阿里云CTO周靖人在会后专访中表示,对文档、图像等轻度处理的工作,1.8B体量的模型已经完全能够胜任。

另外,阿里云也首次开源了音频理解大模型Qwen-Audio,这是在多模态领域的一次探索。

Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音频的理解,甚至基于音频进行文学创作、逻辑推理、故事续写等等。音频理解能够赋予大模型接近人类的听觉能力。

简单来说,现在通义千问不仅能“看”,也能“听”了,而且更加耳聪目明。此前8月,通义千问就开源了视觉理解大模型Qwen-VL,这次发布中也有不少提升:通用OCR、视觉推理、中文文本理解基础能力都有升级,还能处理各种分辨率和规格的图像,还能“看图做题”。

通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型

△通义千问开源大模型家族

可以说,本次发布模型,对应着三个定位:72B意在对标顶尖开源模型;1.8B则是消费侧落地的探索;而Qwen-Audio则是多模态的新探索——这是未来的重要方向。

当前,阿里云的大模型社区“魔搭”已经有超过150万的模型下载量。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,用阿里云百炼平台、阿里云人工智能平台PAI也可以辅助用户定制大模型应用和深度适配,阿里云也配有轻量级微调、全参数微调、分布式训练、离线推理验证、在线服务等多种功能。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-12-01 23:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

MediaTek携手阿里云在天玑移动平台完成通义千问大模型端侧部署
...与阿里云达成深度合作,双方在天玑9300移动平台上完成通义千问大模型小尺寸版本的端侧部署,该部署可适配天玑8300移动平台,可实现离线状态下即时且精准的多轮人机对话问答。未来
2024-03-28 15:35:00
阿里云与联发科合作开启手机端AI:通义千问大模型落地天玑9300
...关注。据悉,联发科成功在其旗舰芯片天玑9300上部署了通义千问大模型,标志着手机端AI迈向了全新的里程碑。这一合作将为智能手机端的AI应用带来深远影响,也彰显了两家公司在人工
2024-03-29 09:47:00
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
通义大模型发布一周年之际,迎来重要的历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo
2024-05-09 12:00:00
阿里云通义开源最强过程奖励PRM模型 7B尺寸比GPT-4o更能发现推理错误
快科技1月16日消息,今日,阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型
2025-01-16 14:56:00
阿里云挥出“三板斧”:免费也要挣到钱
...阿里云成为国内首个宣布开源自研模型的科技企业,推出通义千问第一代开源模型Qwen;2024年2月,1.5代开源模型Qwen1
2024-06-28 18:08:00
本文转自:新华网12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练
2023-12-01 13:33:00
中国企业调用大模型日均超10万亿Tokens,阿里通义份额第一
...场大模型的日均总消耗量为 10.2 万亿 Tokens,其中,阿里通义占比17.7%位列第一,成为目前中国企业选择最多的大模型
2025-09-01 13:55:00
阿里最新开源推理模型发布:性能比肩DeepSeek-R1
阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。3月6日凌晨,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B
2025-03-06 13:22:00
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
IT之家 9 月 2 日消息,阿里云通义千问今日宣布开源第二代视觉语言模型 Qwen2-VL,并推出 2B、7B 两个尺寸及其量化版本模型
2024-09-03 09:45:00
更多关于科技的资讯:
浪潮智慧文旅“智享商旅 聚力同行”2025浪潮商旅服务日成功举办
鲁网12月30日讯12月25日,由山东浪潮智慧文旅产业发展有限公司主办、山东浪潮智慧空间技术服务有限公司承办的“智享商旅·聚力同行——2025浪潮商旅服务日”在浪潮科技园圆满落幕
2025-12-30 17:23:00
潮新闻讯 浙商,是商业期刊的常客。2025年,他们的名字却接连登上《细胞》(Cell)《自然》(Nature)《科学》(Science)等学术期刊的作者栏
2025-12-30 17:52:00
扎根毕节十年,年产能超7500万只,出口覆盖欧非亚——贵州贵航新能源科技有限公司,已成为推动区域新能源产业链发展的“关键一环”
2025-12-30 18:35:00
肯悦咖啡苹果冰雕点亮冰城 代言人白敬亭助阵亮灯迎新春
2025年12月29日,肯悦咖啡在哈尔滨中央大街举办了一场别开生面的“红苹果心愿季”冰雕点灯仪式。肯悦咖啡的巨型红色咖啡杯造型冰雕搭配“水晶”苹果
2025-12-30 18:50:00
博士创新站典型案例|保定市鑫诺电科软件开发有限公司博士创新站:校企协同创新赋民生
当前供水行业智能化转型加速推进,保定市鑫诺电科软件开发有限公司作为本地企业,在技术层面面临自主开发的智能客服系统缺乏适配技术
2025-12-30 19:36:00
京东京喜自营2025年成交额增长10倍 5大产业带订单量破亿
2025年即将结束,回看这一年,外贸逆袭、市场反内卷、AI全面爆发,用户消费需求回归理性,带动品质消费。今日,京东旗下特价购物品牌京喜自营披露了这一年的成绩单——2025年实现成交额10倍增长
2025-12-30 19:48:00
事关以旧换新!河南公开征集
大河网讯 为深入推进2026年消费品以旧换新政策实施,河南省商务厅日前正式发布《河南省2026年消费品以旧换新家电及数码智能产品参与品牌厂家征集公告》
2025-12-30 19:55:00
博士创新站典型案例|英利能源发展有限公司博士创新站:携手高校突破技术瓶颈
在全球“双碳”目标推动下,光伏产业成为新能源领域核心赛道。晶体硅太阳电池占据光伏市场主要份额,但高效光伏电池需切割分片制成组件
2025-12-30 18:04:00
博士创新站典型案例|石家庄数英仪器有限公司博士创新站:攻克高次谐波源国产化难题
随着新能源发电并网比例不断提高,光伏逆变引入的谐波频率日益升高,对电网谐波测量提出了新的技术要求。当前,国内市场主流谐波标准源的谐波次数普遍低于100次
2025-12-30 18:16:00
还在用App来回倒腾文件?鸿蒙6一碰即传,感受分享的魔法
傻瓜相机的发明,将人们从复杂的调焦、测光操作中解放出来,把摄影门槛拉低到有手就行。而在这个随身电子设备越来越多的时代,人们需要在跨设备文件
2025-12-30 13:04:00
把数字安全感还给用户:HarmonyOS 6的三道主动防御防线
在万物互联的数字时代,个人隐私的边界正变得日益模糊。我们或许都曾经历过这样的时刻:经常接到诈骗骚扰电话,或是家人手机里充斥着乱七八糟
2025-12-30 13:05:00
中国消费者报杭州讯(记者施本允)近日,浙江省台州市消费者权益保护委员会发布2025年电动自行车安全头盔比较试验报告。在随机购买的25款样品中
2025-12-30 14:20:00
高途高中朱汉祺获评“2025·教育匠心人物” 双博士背景赋能英语教育创新
2025年度央广网教育盛典近日落下帷幕,大会以“智启未来 育梦致远”为核心议题,对教育领域深耕教研、推动行业发展的标杆人物进行表彰
2025-12-30 14:21:00
聚焦深度运营,感恩会员同行:太原吾悦广场会员盛典暨跨年狂欢季璀璨启幕
岁末流光,新年序启。新城控股集团太原吾悦广场隆重推出“吾悦会员盛典”,诚挚回馈每一位会员的相伴。作为城市潮流社交与家庭欢聚的核心地标
2025-12-30 14:52:00
“坐地日行八万里,巡天遥看一千河。”2025年10月19日,甘肃酒泉,中科宇航力箭一号遥八运载火箭以“一箭三星”的方式
2025-12-30 14:53:00