• 我的订阅
  • 科技

阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源

类别:科技 发布时间:2024-09-03 09:45:00 来源:IT之家

IT之家 9 月 2 日消息,阿里云通义千问今日宣布开源第二代视觉语言模型 Qwen2-VL,并推出 2B、7B 两个尺寸及其量化版本模型。同时,旗舰模型 Qwen2-VL-72B 的 API 已上线阿里云百炼平台,用户可直接调用。

阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源

阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源

据阿里云官方介绍,相比上代模型,Qwen2-VL 的基础性能全面提升:

读懂不同分辨率和不同长宽比的图片,在 DocVQA、RealWorldQA、MTVQA 等基准测试创下全球领先的表现; 理解 20 分钟以上长视频,支持基于视频的问答、对话和内容创作等应用; 具备强大的视觉智能体能力,可自主操作手机和机器人,借助复杂推理和决策的能力,Qwen2-VL 可以集成到手机、机器人等设备,根据视觉环境和文字指令进行自动操作; 理解图像视频中的多语言文本,包括中文、英文,大多数欧洲语言,日语、韩语、阿拉伯语、越南语等。

阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源

阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源

阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源

Qwen2-VL 延续了 ViT 加 Qwen2 的串联结构,三个尺寸的模型都采用了 600M 规模大小的 ViT,支持图像和视频统一输入。

但为了让模型能够更清楚地感知视觉信息和理解视频,团队在架构上进行了一些升级:

一是实现了对原生动态分辨率的全面支持。不同于上代模型,Qwen2-VL 能够处理任意分辨率的图像输入,不同大小图片将被转换为动态数量的 tokens,最小只占 4 个 tokens。这一设计模拟了人类视觉感知的自然方式,确保了模型输入与图像原始信息之间的高度一致性,赋予模型处理任意尺寸图像的强大能力,使得其可以更灵活高效地进行图像处理。

阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源

二是使用了多模态旋转位置嵌入(M-ROPE)方法。传统的旋转位置嵌入只能捕捉一维序列的位置信息,M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三维视频的位置信息,赋予了语言模型强大的多模态处理和推理能力,能让模型更好地理解和建模复杂的多模态数据。

此次 Qwen2-VL 开源的多款模型中的旗舰模型Qwen2-VL-72B 的 API 已上线阿里云百炼平台,用户可通过阿里云百炼平台直接调用 API。

同时,通义千问团队以 Apache 2.0 协议开源了 Qwen2-VL-2B 和 Qwen2-VL-7B,开源代码已集成到 Hugging Face Transformers、vLLM 和其他第三方框架中。开发者可以通过 Hugging Face 和魔搭 ModelScope 下载使用模型,也可通过通义官网、通义 App 的主对话页面使用模型。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-03 11:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

阿里通义千问Github页面突然消失!负责人回应没有跑路
...仍是404状态。在8月底的时候,阿里通义千问还发布了第二代视觉语言模型Qwen2-VL,可以理解20分钟以上长视频,支持基于视频的问答、对话和内容创作等应用。在多个权威测评中
2024-09-05 10:39:00
阿里云开源通义千问多模态大模型Qwen-VL 【阿里云开源通义千问多模态大模型Qwen-VL】《科创板日报》25日讯,阿里云今日推出大规模视觉语言模型Qwen-VL
2023-08-25 12:17:00
中国科学院地化所发布国际首个月球专业大模型,基于通义大模型及阿里云百炼专属版打造
...专业大模型”)。该大模型以视觉、多模态及自然语言等通义系列模型为基模,结合RAG检索增强等技术,于阿里云百炼专属版进行微调及训练。目前在月球撞击坑年代和形态判别上,月球专业大
2024-08-29 15:42:00
阿里云CTO周靖人:全面投入升级AI大基建
...每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎来了年度重磅发布,基础模型升级,性能媲美GPT-4o,发布最强开源模型Qwen2.5系列,同时上架语言、音频、
2024-09-19 15:53:00
大模型下探音视频AI市场,战争才刚刚开始 | ToB产业观察
...之后,还有更多仍在“来的路上”。6月1日,阿里云宣布通义大模型进展,聚焦音视频AI的“通义听悟”正式亮相,成为国内首个开放公测的大模型应用产品。通义听悟其前身是早在2021年
2023-06-07 14:00:00
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
通义大模型发布一周年之际,迎来重要的历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo
2024-05-09 12:00:00
本文转自:新华网12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练
2023-12-01 13:33:00
从云栖大会,看阿里的科技本色
...巴巴宣布了自研大模型的最新进展——千亿级参数规模的通义千问 2.0 正式发布。阿里巴巴宣布,通义千问 2.0 在 10 个权威测评中全面超越 GPT-3
2023-11-01 23:02:00
MediaTek携手阿里云在天玑移动平台完成通义千问大模型端侧部署
...与阿里云达成深度合作,双方在天玑9300移动平台上完成通义千问大模型小尺寸版本的端侧部署,该部署可适配天玑8300移动平台,可实现离线状态下即时且精准的多轮人机对话问答。未来
2024-03-28 15:35:00
更多关于科技的资讯:
兰研荣登2024年度泉州创新企业十强
3月20日,由泉州市委宣传部、市委金融办、市发改委、市工信局、市住建局、市商务局、市退役军人事务局、市数据管理局、市工商联
2025-04-02 14:01:00
SU7事故遇难者家属回应雷军:鲜活生命已离世 车企应对事故有足够的敬畏之心
快科技4月2日消息,昨晚雷军在其个人微博发文对小米SU7近日事故回应,而这也被冲上了热搜。他表示,我代表小米,表示最深切的哀悼
2025-04-02 14:10:00
3月20日,金融科技公司小赢科技发布了其截至2024年12月31日的第四季度及年度未经审计的财务业绩。财务数据显示:截至2024年12月31日的在贷余额为523
2025-04-02 14:26:00
汤臣倍健:跨越性价比,用户爱上“质价比”
鲁网4月2日讯过去几年,流量红利降临,众多低质低价的白牌迎风而起。然而如今流量红利退潮,消费者更加清醒,“性价比”策略也逐渐陷入困境
2025-04-02 14:30:00
传小米汽车内测“安全分Beta”:可评估驾驶行为 降低事故风险
快科技4月2日消息,近日,有媒体报道,小米汽车App正在内测“安全分Beta”系统。该系统将为车主提供全方位的安全评估与优化建议
2025-04-02 14:40:00
李斌回应沈斐接手乐道:首要任务是做好销售基本功
快科技4月2日消息,今日,乐道汽车总裁艾铁成宣布离职,不再担任乐道汽车总裁和蔚来高级副总裁。蔚来还对乐道汽车进行新的人事任命
2025-04-02 14:40:00
宁德时代中国石化达成合作协议:要建10000座换电站
快科技4月2日消息,宁德时代官宣,近日,其与中国石化在北京签署合作框架协议。根据协议,双方将全面深化长期战略合作关系,共同建设覆盖全国的换电生态网络
2025-04-02 14:40:00
Etsy开店的优劣势分析
Etsy作为一个专注于手工艺品、古董以及独特商品的电子商务平台,为创作者和小型企业提供了一个展示和销售产品的机会。开设Etsy店铺可以带来许多好处
2025-04-02 14:42:00
CMEF医疗器械展必看!富丽康液态镜头如何破解手术光学难题?
2025年中国国际医疗器械展览会(CMEF)即将于4月8日-11日在上海国家会展中心震撼启幕!作为全球医疗行业的顶级盛会
2025-04-02 14:45:00
海信空调易省电Pro空调预售:AI省电41%!告别“电费刺客”
3月31日,海信空调正式发布易省电E370Pro,以APF值5.5、AI省电41%的创新突破将空调节能标准提升至全新维度
2025-04-02 14:46:00
近日,作为2025中关村论坛年会的重要组成部分,中关村国际技术交易大会“全球高校科技成果转化促进大会”在北京工业大学举行
2025-04-02 14:54:00
泸州老窖携手《三体》推出联名白酒 开启科幻与传统文化跨界新纪元
2025年3月31日,北京,当千年酒香邂逅宇宙星辰,一场跨越时空的文化碰撞在北京首钢园香格里拉酒店璀璨上演。泸州老窖与科幻巨作《三体》联袂打造的“泸州老窖|三体”与“国窖1573|三体”全球发布会盛大启幕
2025-04-02 15:05:00
智元机器人与顶尖具身智能公司Pi合作:加速具身智能技术落地
快科技4月2日消息,据报道,智元机器人宣布与国际顶尖具身智能公司Physical Intelligence(Pi)建立深度合作伙伴关系
2025-04-02 15:10:00
君乐宝加速科研成果转化,为全球消费者提供科学健康方案
在健康食品产业蓬勃发展的今天,科研创新无疑是推动行业进步的关键力量。以“科学营养”为核心理念的君乐宝乳业集团,始终站在科研创新的前沿
2025-04-02 15:14:00
携手广州领矿,开启多元商业机遇
在广州天河区的商业浪潮中,广州领矿化工产品有限公司宛如一颗闪耀的明星,自2013年扬帆起航以来,不断拓展业务版图,凭借多元产品与优质服务
2025-04-02 15:31:00