• 我的订阅
  • 科技

阿里大模型,再次开源大放送

类别:科技 发布时间:2024-02-20 14:45:00 来源:飞天银狐

阿里大模型,再次开源大放送——

发布Qwen1.5版本,直接放出六种尺寸。

最大的Qwen1.5-72B-Chat模型,在MT-Bench和Alpaca-Evalv2上,超越Claude-2.1、GPT-3.5-Turbo-0613。

甚至在部分任务中,得分已经超过前几个版本的GPT-4。

阿里大模型,再次开源大放送

各地的开发者前来祝贺,其中0.5B的迷你版让不少人都迫不及待想试试。

阿里大模型,再次开源大放送

并且还顺便问问,那个多模态大模型Qwen-VL-Max有可能开源吗?

阿里大模型,再次开源大放送

除此之外,还集成到了Huggingfacetransformers,以及同主流的十余个框架合作,从微调、部署、量化到本地推理一步到位。

01Qwen1.5开源

此次开源发布,主要有四个方面值得关注。

首先,模型系列很多,直接开源了6种尺寸(0.5B、1.8B、4B、7B、14B、72B)的基础模型(base)、聊天模型(chat)以及量化模型(包括Int4和Int8GPTQ模型,以及AWQ和GGUF量化模型)。

阿里大模型,再次开源大放送

其次,更多的生态融入。

目前,Qwen1.5的代码合并到HuggingFacetransformers,使其transformers>=4.37.0而无需trust_remote_code。

此外,还同主流的第三方框架,比如vLLM、用于部署的SGLang、用于量化的AutoAWQ、AutoGPTQ、用于微调的Axolotl、LLaMA-Factory以及用于本地LLM推理的llama.cpp等进行了合作。

Qwen1.5系列可在Ollama、LMStudio等平台上使用。此外,API服务不仅在DashScope上提供,而且在Together.ai上也提供,具有全球可访问性。

阿里大模型,再次开源大放送

再者,性能更强。

比如在基本能力的评估上,包括MMLU(5-shot)、C-Eval、Humaneval、GS8K、BBH等基准测试中可以看到,Qwen1.5-72B一些分数上已经超过了GPT-4。

阿里大模型,再次开源大放送

在长上下文支持上,全系列模型的能力都有一定的拓展。尤其Chat模型,像Qwen1.5-7B-Chat这样的小模型,在5个任务中有4个表现与GPT-3.5相当。

而Qwen1.5-72B-Chat的性能,则明显优于GPT3.5-turbo-16k,略微落后于GPT4-32k。

阿里大模型,再次开源大放送

在代码执行上,72B聊天模型在数学以及可视化方面离GPT-4还有一定的差距,但代码可执行率超过GPT-4。不过他们表示,会在在未来的版本中得到增强。

阿里大模型,再次开源大放送

除此之外,此次功能也得到了升级和统一。

全系列均统一支持至少32k的最大长度;

多语言能力全面提升并提供了更丰富的多语言评测;

全系列统一支持systemprompt;

统一具备强链接外部系统能力(agent/RAG/Tool-use/Code-interpreter)

02OneMoreThing

这两天,与阿里大模型的进展还不少。

比如前几天,其多模态大模型Qwen-VL-Max登顶OpenCompass榜首。

阿里大模型,再次开源大放送

以及在通义千问APP上,上线了不少春节免费新应用,比如全家福、拜新年、万物成龙等图像生成的功能。

阿里大模型,再次开源大放送

此外,还有网友反馈说,通义千问2.0版本升级之后,能力提升得很明显。

阿里大模型,再次开源大放送

你有感受到吗?

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-02-20 18:45:29

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AI翻译界杀手诞生!阿里国际翻译大模型吊打谷歌和GPT-4
...是白」「光腿神」这类翻译却让人啼笑皆非。就在刚刚,阿里国际发布首个商用翻译大模型,电商出海神器真来了!果式文案一出,少不了网友的热议。苹果iOS 18官方7月更新的系统宣传语
2024-10-17 09:49:00
阿里AI三连发,连夺三项第一
7月25日,阿里巴巴全新开源千问3推理模型,性能大幅提升,一举夺下「全球最强开源模型」王座,比肩顶级闭源模型Gemini-2
2025-07-25 21:34:00
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
IT之家 9 月 2 日消息,阿里云通义千问今日宣布开源第二代视觉语言模型 Qwen2-VL,并推出 2B、7B 两个尺寸及其量化版本模型
2024-09-03 09:45:00
阿里巴巴“AI驱动”战略提速 夸克发布自研大模型
本文转自:新华网11月14日,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型,将应用于通用搜索、医疗健康、教育学习、职场办公等众多场景。夸克App将借助自研大模型全面
2023-11-14 16:05:00
重磅!“国奖”放榜:十年来AI 领域首个国奖一等奖花落科大讯飞
...项重磅揭榜。在获奖名单中,我们看到华为、科大讯飞、阿里云、小米等科技公司出现,而科大讯飞作为第一完成单位的“多语种智能语音关键技术及产业化”项目,更是斩获国家科学技术进步奖一
2024-06-26 09:15:00
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
...| 搜狐科技作者 | 梁昌均编辑 | 杨锦一口气开源8款模型,阿里通义又上新!4月29日一大早,阿里开源发布Qwen3
2025-04-29 16:17:00
阿里云正式发布“通义听悟” 首款面向消费者端产品
【CNMO新闻】阿里云智能于6月1日发布通义听悟,并面向公众开放公测。阿里云智能CTO周靖人表示,通义听悟是依托通义千问大模型和音视频AI模型的AI助手,可进行实时语音识别,实现
2023-06-07 17:27:00
阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用
阿里通义千问已成全球第一大开源模型系列,将“很快”放出基于最新模型Qwen2.5-Max的推理模型。2月21日,全球开发者大会(GDC)在上海开幕,在阿里云魔搭社区主办的论坛上,
2025-02-21 23:22:00
阿里通义开源模型Qwen2.5力压Claude3.5、GPT-4o等顶级闭源模型
...们,今天我要和你分享一个非常令人兴奋的消息,那就是阿里巴巴的通义大模型系列中的一员——Qwen2.5,最近在自然语言处理领域取得了惊人的成绩
2024-10-31 09:47:00
更多关于科技的资讯:
普阳钢铁工程机械用高强高韧宽厚板全国市场占有率名列前茅一块宽厚板的靶向发力——“铁疙瘩”怎样变成“金娃娃”(十)从矿山到港口
2025-10-05 07:47:00
人气旺 厦门多个商场假日客流爆棚、销售额亮眼
集美大悦城商圈内,小朋友和机器人亲密互动。(本组图/厦门日报记者 黄晓珍 摄)国庆中秋假期, 厦门SM购物中心潮玩店内人气火爆
2025-10-04 09:20:00
省数据和政务服务局发布公告公开征集一批河北省高质量数据集河北日报讯(记者解楚楚)9月26日,河北省数据和政务服务局发布公告
2025-10-04 08:03:00
央媒看太原9月30日,央视财经频道《经济信息联播》栏目以《双节市场备货足美食特产受青睐》为题,报道了假期到来,太原市各大综合市场提前备货
2025-10-04 07:17:00
厦门网讯(厦门日报记者 朱道衡)近日,2025鼓浪屿世遗文创作品征集活动启动。此次活动面向全国(含港澳台地区)高校、企业
2025-10-03 08:37:00
厦门网讯(厦门日报记者 楚燕 通讯员 石青青)长假期间,许多人从忙碌的工作中解脱出来,趁机好好休息。可是,如果休息方式不得当
2025-10-03 08:37:00
渤海之潮涌动着澎湃的脉搏,海河之畔镌刻着科技的印记。10年前,一颗带有“清华”基因的种子在天津这片沃土扎根;10年后,它长成一棵枝繁叶茂的参天大树
2025-10-03 09:25:00
太燃了!无人机空中展旗!高新区国庆“氛围组”已上线!
2025-10-03 23:48:00
抖音生活服务联合北京卫视发起“老板驾到”直播活动,吸引用户下单超100万元团购券
9月29日,抖音生活服务联合北京卫视发起“老板驾到”直播活动,助力北京国庆中秋消费。抖音用户在@北京卫视 直播间下单超1万次
2025-10-03 18:36:00
“FutureBOT未来引力”2025北京机器人文化节首日盛况 打造国庆科技打卡新地标
国庆首日,“FutureBOT未来引力”2025北京机器人文化节在北京昌平超极合生汇正式拉开帷幕,成为国庆假期极具科技温度的打卡地
2025-10-03 19:06:00
走到白石山巅的尽头,这家建在悬崖边的“云端咖啡厅”绝对让你惊呼。
2025-10-03 11:37:00
泰康人寿发布新品“泰康百万药无忧(庆典版)医疗保险”(以下‬简称“百万药无忧”),以广覆盖、易投保、强保障、低费率为优势
2025-10-03 09:17:00
厦门网讯(厦门日报记者 翁华鸿 通讯员 林雨新)在近日举行的2025全球数据管理峰会“数据要素分论坛暨大数据统计与人工智能技术创新管理研讨会”上
2025-10-03 08:38:00
兴趣-实践-视野:达芬奇金奖少年带来的教育启示录
摘要:2025“你是达芬奇”全球青少年科学与艺术创新赛圆满落幕,其中金奖获奖少年的亲身实践告诉我们,在AI赋能的新时代
2025-10-02 16:22:00
单日调用近1万亿次,高德助力北斗规模化民用跨入新量级
2025年10月1日,随着国庆长假首日出行高峰的到来,高德基于北斗卫星导航系统的定位数量接近1万亿次,支撑导航总里程数超90亿公里
2025-10-02 22:31:00