• 我的订阅
  • 科技

华中科技大学白翔教授发布多模态大模型

类别:科技 发布时间:2023-12-15 01:14:00 来源:浅语科技

12月14日消息,据华中科技大学消息,近日,华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。

华中科技大学白翔教授发布多模态大模型

▲图源Monkey项目的GitHub页面

IT之家注:多模态大模型是一类可以同时处理和整合多种感知数据(例如文本、图像、音频等)的AI架构。

据介绍,Monkey模型在18个数据集上的实验中表现出色,特别是在图像描述和视觉问答任务方面,超越了众多现有知名的模型如微软的LLAVA、谷歌的PALM-E、阿里的Mplug-owl等。此外,Monkey在文本密集的问答任务中显示出“显著的优势”,甚至在某些样本上超越了业界公认的领先者——OpenAI的多模态大模型GPT-4V。

华中科技大学白翔教授发布多模态大模型

Monkey的一个显著特点是“看图说话”能力。在详细描述任务中,Monkey展现了对图像细节的感知能力,能够察觉到其他多模态大模型所忽略的内容。如对下图进行的文本描述中,Monkey正确地将其识别为埃菲尔铁塔的绘画,并提供了构图和配色方案的详细描述。而对左下角的文字,只有Monkey和GPT-4V能将其准确地识别为作者名。

华中科技大学白翔教授发布多模态大模型

Monkey号称能够利用现有的工具构建一种多层级的描述生成方法,即通过五个步骤依次对图片进行整体简述、空间定位、模块化识别、描述赋分选取和最终总结,此举可以充分结合不同工具的特性,提升描述的准确性和丰富程度。

华中科技大学白翔教授发布多模态大模型

“一个个工具就好比不同的零件,合理的排列组合才能使其发挥最大作用,”白翔教授说,“我们团队从2003年开始便从事图像识别研究,去年我们又从海外引进了专攻多模态大模型的青年人才,Monkey的最终方案是大家一起反复讨论,尝试了10余种方案后最终确定的。”白翔教授说。

Monkey的另一亮点是能够处理分辨率最高1344×896像素的图像,这是目前其他多模态大模型所能处理的最大尺寸的6倍,这意味着Monkey能对更大尺寸的图片进行更准确、丰富、细致的描述甚至推理。

Monkey多模态大模型代码目前已在GitHub开源。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-12-15 05:45:22

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...荣嵘、中国人民大学高瓴人工智能学院助理教授李崇轩、华中科技大学电信学院教授王兴刚、中山大学教授林倞等授课。课程内容包括《语言基础模型的重要特性》《视觉大模型:自监督预训练以及
2023-09-24 07:09:00
中新网武汉8月7日电 (常宇)据华中科技大学同济医学院附属同济医院7日消息,该院消化内科程斌教授团队开发了一款针对胰腺肿瘤诊断的多模态AI模型,可基于患者的临床信息与超声内镜图片
2024-08-07 13:45:00
西云算力举办AIGC沙龙,CTO梁峰分享“全系列全场景智算基础设施”
...人工智能产业发展。本期参会嘉宾介绍梁峰 西云算力CTO华中科技大学硕士学位,12年腾讯工作经历,其中10年专注于腾讯视频技术研发,随后投身于 GPU 云计算创业,担任 CTO
2024-04-15 19:00:00
华科大首次为本科生设立自然科学创新基金,入选项目将最高获得5万元科研经费
...了具有四个独立通道的复振幅波导全息成像”……近日,华中科技大学西五教学楼里,一场由本科生主导的“头脑风暴”火热上演,5个组别、63个项目,他们角逐的是20个首届“2024年度
2024-07-13 09:40:00
聚焦“数智创新 AI未来” :2023数据与存储峰会圆满落幕
...机遇。中国计算机行业协会信息存储与安全专委会会长、华中科技大学武汉光电国家研究中心教授 谢长生数据的爆发式增长,让中国计算机行业协会信息存储与安全专委会会长、华中科技大学武汉
2023-11-30 11:48:00
中国多所高校接入Deep Seek大模型
...守学术伦理规范,避免误用、滥用带来的科研诚信风险。华中科技大学计算机科学与技术学院教授魏巍认为,人机协同将是大势所趋。对高校而言,可通过增设AI相关课程,帮助师生更好地提高A
2025-02-21 17:17:00
华中师大一附中与华中科技大学携手推出“数字人项目” 共育未来世界的引领者
...范大学第一附属中学(以下简称“华中师大一附中”)与华中科技大学携手合作,用创新实践给出了有力回答。4月19日,双方共建的“数字人项目”正式亮相,展现了基础教育与高等教育在拔尖
2025-04-22 10:38:00
...200人,其中产研人员占比达80%。金山办公还与武汉大学、华中科技大学等多所一流高校签订校企合作协议,助力产学研一体化发展。未来,金山办公将在武汉将持续加大研发投入,将武汉打
2023-09-21 16:20:00
2025长寿时代论坛在武汉举办
...老需求大幅增长,大健康产业的发展步入了“快车道”。华中科技大学同济医学院附属同济医院党委副书记、院长、第二临床学院院长胡俊波表示,如何应对长寿时代带来的机遇和挑战,是实施健康
2025-04-09 15:41:00
更多关于科技的资讯:
2025雄安未来影像电影季落幕全球公开征集科幻短片367部河北日报讯(见习记者郝金钰)8月22日至24日,“永不落幕的北影节之2025雄安未来影像电影季”系列活动成功举办
2025-09-01 08:06:00
“双胞胎”首进“千亿俱乐部”
本报讯 信息日报全媒体记者左阳天报道:全国工商联28日在辽宁沈阳发布“2025中国民营企业500强”。京东集团、阿里巴巴(中国)有限公司
2025-09-01 05:31:00
快意电梯与山东昌邑泰和达成合作 以防爆货梯赋能电子新材料产业安全升级
近日,快意电梯与昌邑泰和新材料科技有限公司正式签署合作协议,将为山东潍坊昌邑市沿海经济开发区电子新材料生产基地提供多台ATLAS-EX系列防爆货梯
2025-09-01 07:46:00
2025年上海合作组织峰会
2025-08-31 23:11:00
【2025数博会】无相智研科研大模型AI平台助力科研范式变革
8月30日,2025中国国际大数据产业博览会在贵阳圆满落下帷幕,无相智研科研大模型AI平台(简称“无相智研平台”)在27日举行的贵州数字产业生态合作交流推介会上正式首发
2025-09-01 02:46:00
学习机销售蹭上开学热 各品牌争相推出促销活动
家长和学生在厦门外图书城学习机品牌专柜选购。厦门网讯(厦门日报记者 郭睿)开学前,学习机市场迎来销售热潮。记者昨日走访厦门外图书城
2025-08-31 08:44:00
“两山”转化 黔东有“数”|数字赋能铜仁生态产品价值转化
8月28日,2025年“数据要素×”大赛贵州分赛获奖项目路演展示活动在贵阳举行,铜仁市申报的“基于数据要素乘数效应的生态信用数据资产开发与流通体系”项目
2025-08-31 11:10:00
鲁网8月31日讯8月31日下午,亚马逊云科技跨境出海峰会将在临沂沂河新区白沙埠镇天河产业园启幕,汇聚跨境电商企业、行业专家
2025-08-31 12:25:00
2025年上海合作组织峰会
2025-08-31 12:37:00
【2025数博会】阶跃星辰副总裁赵海涛:多模态是通向AGI的必经之路
8月29日,在2025数博会“数智无界·开放式创新驱动产业跃迁”主题活动上,阶跃星辰副总裁赵海涛以“多模态是通向AGI的必经之路”为主旨
2025-08-31 15:51:00
“鸿蒙生态学堂·游戏专班”上海开班!百名开发者共拓鸿蒙游戏生态新篇章
2025年8月28日至29日,由华为游戏中心与鸿蒙生态学堂共同主办的“鸿蒙生态学堂·游戏专场上海站”在上海浦东滨江喜来登酒店成功举行
2025-08-31 17:11:00
HarmonyOS教育行业解决方案,使能教育App高效上架、体验创新
为帮助开发者实现快速开发及上架,华为已推出HarmonyOS教育行业解决方案,结合HarmonyOS的技术特性如一次开发多端部署
2025-08-31 17:14:00