• 我的订阅
  • 科技

720亿参数模型开源 通义千问已实现“全尺寸、全模态”开源

类别:科技 发布时间:2023-12-01 13:33:00 来源:每日看点快看

本文转自:新华网

12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练,在10个权威基准测评中夺得开源模型优异成绩。基于Qwen-72B,大中型企业可开发商业应用,高校、科研院所可开展AI for Science等科研工作。

据介绍,Qwen-72B可以处理最多32k的长文本输入,研发团队优化了Qwen-72B的指令遵循、工具使用等技能,使之能更好地被下游应用集成。比如,Qwen-72B搭载了强大的系统指令(System Prompt)能力,用户只用一句提示词就可定制AI助手,要求大模型扮演某个角色或者执行特定的回复任务。

随着Qwen-72B的开源,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。开源模型Qwen-1.8B,推理2K长度文本内容仅需3G显存,可在消费级终端部署。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音频的理解,甚至基于音频进行文学创作、逻辑推理、故事续写等等。

至此,通义千问共开源18亿、70亿、140亿、720亿参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。阿里云人工智能平台PAI针对通义千问全系列模型进行深度适配,推出了轻量级微调、全参数微调、分布式训练、离线推理验证、在线服务部署等服务。

阿里云CTO周靖人表示,开源生态对促进中国大模型的技术进步与应用落地至关重要。通义千问将持续投入开源,希望成为“AI时代最开放的大模型”,与伙伴们共同促进大模型生态建设。

据了解,阿里云是国内最早开源自研大模型的科技企业之一,8月以来开源了Qwen-7B、Qwen-14B和视觉理解模型Qwen-VL,得到中小企业和个人开发者的青睐,累计下载量超过150万,催生出150多款新模型、新应用。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-12-01 14:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
通义大模型发布一周年之际,迎来重要的历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo
2024-05-09 12:00:00
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
时隔一个月,通义千问又放大招了!在一个月前的阿里云栖大会上,阿里正式发布通义千问2.0版本,在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上,都有较大提升。并且,阿
2023-12-01 21:07:00
MediaTek携手阿里云在天玑移动平台完成通义千问大模型端侧部署
...与阿里云达成深度合作,双方在天玑9300移动平台上完成通义千问大模型小尺寸版本的端侧部署,该部署可适配天玑8300移动平台,可实现离线状态下即时且精准的多轮人机对话问答。未来
2024-03-28 15:35:00
阿里云开源通义千问多模态大模型Qwen-VL 【阿里云开源通义千问多模态大模型Qwen-VL】《科创板日报》25日讯,阿里云今日推出大规模视觉语言模型Qwen-VL
2023-08-25 12:17:00
阿里云与联发科合作开启手机端AI:通义千问大模型落地天玑9300
...关注。据悉,联发科成功在其旗舰芯片天玑9300上部署了通义千问大模型,标志着手机端AI迈向了全新的里程碑。这一合作将为智能手机端的AI应用带来深远影响,也彰显了两家公司在人工
2024-03-29 09:47:00
阿里Q3财报:核心业务收获稳健增长,“AI驱动”潜力初现
...等场景化应用。季度内,阿里云发布业界最强开源大模型通义千问Qwen-72B。淘宝天猫、阿里国际数字商业发布了多款AI工具辅助商家经营提效,加速推进AI电商场景落地。钉钉、夸克
2024-02-07 22:43:00
中国企业调用大模型日均超10万亿Tokens,阿里通义份额第一
...场大模型的日均总消耗量为 10.2 万亿 Tokens,其中,阿里通义占比17.7%位列第一,成为目前中国企业选择最多的大模型
2025-09-01 13:55:00
大模型下探音视频AI市场,战争才刚刚开始 | ToB产业观察
...之后,还有更多仍在“来的路上”。6月1日,阿里云宣布通义大模型进展,聚焦音视频AI的“通义听悟”正式亮相,成为国内首个开放公测的大模型应用产品。通义听悟其前身是早在2021年
2023-06-07 14:00:00
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
IT之家 9 月 2 日消息,阿里云通义千问今日宣布开源第二代视觉语言模型 Qwen2-VL,并推出 2B、7B 两个尺寸及其量化版本模型
2024-09-03 09:45:00
更多关于科技的资讯:
厦大智慧教室迈入“无感扩声”时代教师无需佩戴麦克风,声音可清晰覆盖整个教室东南网9月19日讯 (海峡导报记者 梁静 通讯员 戴佩琪)新学期伊始
2025-09-19 10:26:00
为积极推动实现“专业化、生态化、数字化”战略远景,积极服务大局,在人工智能的浪潮中,切实推进“保险+”服务的建设,瑞众人寿河北分公司将在全省开展以“拾光美好·瑞意相伴”为主题的客户嘉年华活动
2025-09-19 10:14:00
满算力每天可产出上百万分钟视频,成本只需人工的10%宁企AI“拍”短剧,拓展“数字丝路”新蓝海□南京日报/紫金山新闻特派记者黄琳燕9月18日
2025-09-19 07:44:00
光博会上,宁企全球首发先进高光谱成像相机粉笔灰冒充面粉?“天眼”一拍现原形南报网讯(记者张安琪)“两堆白色粉末摆在眼前
2025-09-19 07:45:00
厦门网讯(厦门日报记者 刘艳)昨日,2025金砖国家新工业革命伙伴关系论坛6场平行分论坛发布6项成果。此次金砖国家新工业革命伙伴关系论坛共发布了12项成果
2025-09-18 08:20:00
一口预制菜,搅动全民心。近日,罗永浩与西贝的“预制菜之争”告一段落,但引发的消费者知情权问题,仍备受关注。罗永浩与西贝争论的焦点
2025-09-18 09:31:00
近日,国家知识产权局知识产权运用促进司在全国专利转化运用专项行动工作简报中,对山东科创旗下山东知识产权运营中心的创新实践工作给予充分肯定
2025-09-18 09:33:00
浪浪山小妖怪14亿票房背后,500元的毛绒玩具卖爆了
作者|兰杰编辑|乔芊又一个毛绒品牌正在崭露头角。近期,《浪浪山的小妖怪》收割了无数打工人的心,同时也让一个水下的品牌浮出水面
2025-09-18 17:53:00
把直播开成文化沙龙,中产迷上这“最安静”直播
没有秒杀倒计时,没有循环播放的背景音乐,更没有声嘶力竭的“3、2、1,上链接!”9月5日晚,ICICLE之禾的抖音直播间
2025-09-18 21:11:00
海外正畸专家到访正雅,深度研讨颌位重建技术
近日,来自意大利、泰国和沙特阿拉伯的正畸医生代表团访问了正雅并参观了位于嘉兴的智能工厂,开展了一场关于数字化正畸技术与智能制造融合的深度交流活动
2025-09-18 13:53:00
不靠运气,小众农货如何变成国民爆款?
“挖到宝了,买到了纯甜的黄金百香果!”“不允许还有人没吃过寿光的彩椒!”“是我肤浅了,青皮的冰糖橙居然不酸的?”近些年
2025-09-18 14:13:00
SKEMA商学院《金融时报》管理学硕士排名跃升至全球第18名
2025年MiM排名创历史新高,商科教育领跑全球2025年9月,权威商科教育排名再传佳讯。英国《金融时报》最新发布的2025年管理学硕士(Master in Management
2025-09-18 14:13:00
一场Open Mic,聊出行业新未来
近日,中国建博会(广州)媒体交流会——Open Mic!敞开聊!于上海圆满举办,现场邀请了澎湃新闻、财经网、1m建筑装饰沙龙学会
2025-09-18 14:14:00
妙可蓝多全球首创奶酪RDA数据资产在沪启动
随着信息技术深入发展和深度应用,数据已经成为生产经营活动必不可少的新生产要素。当前,我国将数据正式列为与土地、资本、劳动力
2025-09-18 14:22:00
2025腾讯全球数字生态大会:聚焦“AI+传媒”新趋势,腾讯云打造新一代智能化服务底座
9月16日,2025腾讯全球数字生态大会在深圳国际会展中心举办。智慧传媒专场以“AI+传媒:从效率革命到价值重构”为主题
2025-09-18 14:44:00