• 我的订阅
  • 科技

阿里大模型,再次开源大放送

类别:科技 发布时间:2024-02-20 14:45:00 来源:飞天银狐

阿里大模型,再次开源大放送——

发布Qwen1.5版本,直接放出六种尺寸。

最大的Qwen1.5-72B-Chat模型,在MT-Bench和Alpaca-Evalv2上,超越Claude-2.1、GPT-3.5-Turbo-0613。

甚至在部分任务中,得分已经超过前几个版本的GPT-4。

阿里大模型,再次开源大放送

各地的开发者前来祝贺,其中0.5B的迷你版让不少人都迫不及待想试试。

阿里大模型,再次开源大放送

并且还顺便问问,那个多模态大模型Qwen-VL-Max有可能开源吗?

阿里大模型,再次开源大放送

除此之外,还集成到了Huggingfacetransformers,以及同主流的十余个框架合作,从微调、部署、量化到本地推理一步到位。

01Qwen1.5开源

此次开源发布,主要有四个方面值得关注。

首先,模型系列很多,直接开源了6种尺寸(0.5B、1.8B、4B、7B、14B、72B)的基础模型(base)、聊天模型(chat)以及量化模型(包括Int4和Int8GPTQ模型,以及AWQ和GGUF量化模型)。

阿里大模型,再次开源大放送

其次,更多的生态融入。

目前,Qwen1.5的代码合并到HuggingFacetransformers,使其transformers>=4.37.0而无需trust_remote_code。

此外,还同主流的第三方框架,比如vLLM、用于部署的SGLang、用于量化的AutoAWQ、AutoGPTQ、用于微调的Axolotl、LLaMA-Factory以及用于本地LLM推理的llama.cpp等进行了合作。

Qwen1.5系列可在Ollama、LMStudio等平台上使用。此外,API服务不仅在DashScope上提供,而且在Together.ai上也提供,具有全球可访问性。

阿里大模型,再次开源大放送

再者,性能更强。

比如在基本能力的评估上,包括MMLU(5-shot)、C-Eval、Humaneval、GS8K、BBH等基准测试中可以看到,Qwen1.5-72B一些分数上已经超过了GPT-4。

阿里大模型,再次开源大放送

在长上下文支持上,全系列模型的能力都有一定的拓展。尤其Chat模型,像Qwen1.5-7B-Chat这样的小模型,在5个任务中有4个表现与GPT-3.5相当。

而Qwen1.5-72B-Chat的性能,则明显优于GPT3.5-turbo-16k,略微落后于GPT4-32k。

阿里大模型,再次开源大放送

在代码执行上,72B聊天模型在数学以及可视化方面离GPT-4还有一定的差距,但代码可执行率超过GPT-4。不过他们表示,会在在未来的版本中得到增强。

阿里大模型,再次开源大放送

除此之外,此次功能也得到了升级和统一。

全系列均统一支持至少32k的最大长度;

多语言能力全面提升并提供了更丰富的多语言评测;

全系列统一支持systemprompt;

统一具备强链接外部系统能力(agent/RAG/Tool-use/Code-interpreter)

02OneMoreThing

这两天,与阿里大模型的进展还不少。

比如前几天,其多模态大模型Qwen-VL-Max登顶OpenCompass榜首。

阿里大模型,再次开源大放送

以及在通义千问APP上,上线了不少春节免费新应用,比如全家福、拜新年、万物成龙等图像生成的功能。

阿里大模型,再次开源大放送

此外,还有网友反馈说,通义千问2.0版本升级之后,能力提升得很明显。

阿里大模型,再次开源大放送

你有感受到吗?

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-02-20 18:45:29

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

阿里千问App支持119种语言,上线全新实时翻译能力
11月19日,阿里千问App在公测三天后,迅速推出多项翻译能力升级。基于Qwen模型的多语言能力,千问App推出全新实时翻译功能。同时,在内容互译上,支持中文、英文、阿拉伯语、冰
2025-11-19 14:55:00
AI翻译界杀手诞生!阿里国际翻译大模型吊打谷歌和GPT-4
...是白」「光腿神」这类翻译却让人啼笑皆非。就在刚刚,阿里国际发布首个商用翻译大模型,电商出海神器真来了!果式文案一出,少不了网友的热议。苹果iOS 18官方7月更新的系统宣传语
2024-10-17 09:49:00
阿里AI三连发,连夺三项第一
7月25日,阿里巴巴全新开源千问3推理模型,性能大幅提升,一举夺下「全球最强开源模型」王座,比肩顶级闭源模型Gemini-2
2025-07-25 21:34:00
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
IT之家 9 月 2 日消息,阿里云通义千问今日宣布开源第二代视觉语言模型 Qwen2-VL,并推出 2B、7B 两个尺寸及其量化版本模型
2024-09-03 09:45:00
阿里巴巴“AI驱动”战略提速 夸克发布自研大模型
本文转自:新华网11月14日,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型,将应用于通用搜索、医疗健康、教育学习、职场办公等众多场景。夸克App将借助自研大模型全面
2023-11-14 16:05:00
重磅!“国奖”放榜:十年来AI 领域首个国奖一等奖花落科大讯飞
...项重磅揭榜。在获奖名单中,我们看到华为、科大讯飞、阿里云、小米等科技公司出现,而科大讯飞作为第一完成单位的“多语种智能语音关键技术及产业化”项目,更是斩获国家科学技术进步奖一
2024-06-26 09:15:00
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
...| 搜狐科技作者 | 梁昌均编辑 | 杨锦一口气开源8款模型,阿里通义又上新!4月29日一大早,阿里开源发布Qwen3
2025-04-29 16:17:00
阿里云正式发布“通义听悟” 首款面向消费者端产品
【CNMO新闻】阿里云智能于6月1日发布通义听悟,并面向公众开放公测。阿里云智能CTO周靖人表示,通义听悟是依托通义千问大模型和音视频AI模型的AI助手,可进行实时语音识别,实现
2023-06-07 17:27:00
史上首次!米兰冬奥基于阿里千问打造奥运官方大模型
...垂在国际转播中心举行的活动中宣布,国际奥委会已基于阿里千问大模型打造了奥运史上首个官方大模型。考文垂在现场高度评价了AI技术对本届冬奥会的变革性意义。她表示,得益于千问大模型
2026-02-05 13:40:00
更多关于科技的资讯:
高端润滑油的智造密码
2月9日,润滑油北京有限公司员工加紧节前生产,确保高质量交付客户产品。本报记者 程阳 摄 郑德辉 文2月9日,中国石化报记者来到润滑油北京有限公司
2026-02-12 11:53:00
中新经纬2月12日电 据“北京市场监管”微信号12日消息,近日,北京市市场监督管理局组织携程、去哪儿、飞猪、同程、美团
2026-02-12 11:57:00
聚焦雄安新区丨“人工智能+”开拓产业发展新赛道
“人工智能+”开拓产业发展新赛道——2026年雄安新区“人工智能+”创新生态系列活动观察人工智能,是雄安新区大力发展的主导产业之一
2026-02-12 08:47:00
在多个短视频平台和电商平台上,不少账号公开发布视频,称可以绕开一些平台的人脸识别验证。这些视频中,有人遮挡住手机摄像头
2026-02-12 08:58:00
当前,健康中国战略深入实施,智能健身市场需求激增,舒华体育深化"AI运动科技"定位,推动奥运技术全面渗透至各类场景,让大众共享科学健身成果
2026-02-12 09:28:00
以旧换新激活潍坊消费新引擎:一场政策引领的绿色消费革命
鲁网2月11日讯(记者 王玉龙)2025年,潍坊市消费品以旧换新直接拉动消费160亿元,是2024年的4.2倍;129万人次享受到20
2026-02-12 09:56:00
“西湖纹样”小程序正式上线杭州日报讯 第十九届杭州文博会上,西湖区的展馆前天天大排长龙。纹样编织袋、纹样透卡、纹样茶点礼盒
2026-02-12 06:41:00
2月6日,上海超导科技股份有限公司向太原钢铁(集团)有限公司发出一封感谢信,披露太钢与该企业一场历时五年的联合攻坚结出的硕果
2026-02-12 07:31:00
李建南摘要:随着大模型在预测、生成与复杂模式识别中的广泛应用,统计建模范式正在经历深刻转变。相较于以概率假设与参数推断为核心的传统统计模型
2026-02-12 07:32:00
以科技自立自强构筑创新高地杭州日报讯 近日,在湖州莫干山高新区,灵心巧手(Linkerbot)年产3万套具身智能机器人灵巧手的超级工厂项目正在全速推进
2026-02-12 07:11:00
中新经纬2月11日电 据国家市场监督管理总局网站消息,2月4日,国务院反垄断反不正当竞争委员会印发施行《关于公用事业领域的反垄断指南》(以下简称《指南》)
2026-02-11 20:18:00
季季有主题,周周有优惠!2026年河北省电影惠民观影促消费活动启动
河北日报客户端讯(记者肖煜)为积极响应落实国家电影局全国电影惠民消费季安排,进一步激活河北电影市场消费潜力,丰富群众文化生活
2026-02-11 22:05:00
2025国际宠物博览会落幕:Benarmi倡导全生命周期健康管理
12月20日,2025国际宠物博览会在北京市平谷区博物馆、体育中心拉开帷幕,汇聚全球名宠、产业企业与创新项目,集中展现宠物经济的前沿动态与发展趋势
2026-02-11 20:08:00
“民生科幻”领军人吴楚新作《背叛文明》出版,聚焦星际外交博弈
如果高等文明的馈赠是一颗带毒的蜜糖,那人类是否有智慧拒绝唾手可得的诱惑?当思想需要向未来跨出一大步时,阅读科幻依然是当下最高效的途径
2026-02-11 17:22:00
随着云计算、大数据、人工智能等数智技术的迅猛发展,传统劳动形态正经历着前所未有的变革。工作场所的虚拟化、劳动时间的弹性化以及用工关系的多元化
2026-02-11 17:31:00