• 我的订阅
  • 科技

华中科技大学白翔教授发布多模态大模型

类别:科技 发布时间:2023-12-15 01:14:00 来源:浅语科技

12月14日消息,据华中科技大学消息,近日,华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。

华中科技大学白翔教授发布多模态大模型

▲图源Monkey项目的GitHub页面

IT之家注:多模态大模型是一类可以同时处理和整合多种感知数据(例如文本、图像、音频等)的AI架构。

据介绍,Monkey模型在18个数据集上的实验中表现出色,特别是在图像描述和视觉问答任务方面,超越了众多现有知名的模型如微软的LLAVA、谷歌的PALM-E、阿里的Mplug-owl等。此外,Monkey在文本密集的问答任务中显示出“显著的优势”,甚至在某些样本上超越了业界公认的领先者——OpenAI的多模态大模型GPT-4V。

华中科技大学白翔教授发布多模态大模型

Monkey的一个显著特点是“看图说话”能力。在详细描述任务中,Monkey展现了对图像细节的感知能力,能够察觉到其他多模态大模型所忽略的内容。如对下图进行的文本描述中,Monkey正确地将其识别为埃菲尔铁塔的绘画,并提供了构图和配色方案的详细描述。而对左下角的文字,只有Monkey和GPT-4V能将其准确地识别为作者名。

华中科技大学白翔教授发布多模态大模型

Monkey号称能够利用现有的工具构建一种多层级的描述生成方法,即通过五个步骤依次对图片进行整体简述、空间定位、模块化识别、描述赋分选取和最终总结,此举可以充分结合不同工具的特性,提升描述的准确性和丰富程度。

华中科技大学白翔教授发布多模态大模型

“一个个工具就好比不同的零件,合理的排列组合才能使其发挥最大作用,”白翔教授说,“我们团队从2003年开始便从事图像识别研究,去年我们又从海外引进了专攻多模态大模型的青年人才,Monkey的最终方案是大家一起反复讨论,尝试了10余种方案后最终确定的。”白翔教授说。

Monkey的另一亮点是能够处理分辨率最高1344×896像素的图像,这是目前其他多模态大模型所能处理的最大尺寸的6倍,这意味着Monkey能对更大尺寸的图片进行更准确、丰富、细致的描述甚至推理。

Monkey多模态大模型代码目前已在GitHub开源。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-12-15 05:45:22

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...荣嵘、中国人民大学高瓴人工智能学院助理教授李崇轩、华中科技大学电信学院教授王兴刚、中山大学教授林倞等授课。课程内容包括《语言基础模型的重要特性》《视觉大模型:自监督预训练以及
2023-09-24 07:09:00
中新网武汉8月7日电 (常宇)据华中科技大学同济医学院附属同济医院7日消息,该院消化内科程斌教授团队开发了一款针对胰腺肿瘤诊断的多模态AI模型,可基于患者的临床信息与超声内镜图片
2024-08-07 13:45:00
西云算力举办AIGC沙龙,CTO梁峰分享“全系列全场景智算基础设施”
...人工智能产业发展。本期参会嘉宾介绍梁峰 西云算力CTO华中科技大学硕士学位,12年腾讯工作经历,其中10年专注于腾讯视频技术研发,随后投身于 GPU 云计算创业,担任 CTO
2024-04-15 19:00:00
华科大首次为本科生设立自然科学创新基金,入选项目将最高获得5万元科研经费
...了具有四个独立通道的复振幅波导全息成像”……近日,华中科技大学西五教学楼里,一场由本科生主导的“头脑风暴”火热上演,5个组别、63个项目,他们角逐的是20个首届“2024年度
2024-07-13 09:40:00
聚焦“数智创新 AI未来” :2023数据与存储峰会圆满落幕
...机遇。中国计算机行业协会信息存储与安全专委会会长、华中科技大学武汉光电国家研究中心教授 谢长生数据的爆发式增长,让中国计算机行业协会信息存储与安全专委会会长、华中科技大学武汉
2023-11-30 11:48:00
中国多所高校接入Deep Seek大模型
...守学术伦理规范,避免误用、滥用带来的科研诚信风险。华中科技大学计算机科学与技术学院教授魏巍认为,人机协同将是大势所趋。对高校而言,可通过增设AI相关课程,帮助师生更好地提高A
2025-02-21 17:17:00
华中师大一附中与华中科技大学携手推出“数字人项目” 共育未来世界的引领者
...范大学第一附属中学(以下简称“华中师大一附中”)与华中科技大学携手合作,用创新实践给出了有力回答。4月19日,双方共建的“数字人项目”正式亮相,展现了基础教育与高等教育在拔尖
2025-04-22 10:38:00
...200人,其中产研人员占比达80%。金山办公还与武汉大学、华中科技大学等多所一流高校签订校企合作协议,助力产学研一体化发展。未来,金山办公将在武汉将持续加大研发投入,将武汉打
2023-09-21 16:20:00
2025长寿时代论坛在武汉举办
...老需求大幅增长,大健康产业的发展步入了“快车道”。华中科技大学同济医学院附属同济医院党委副书记、院长、第二临床学院院长胡俊波表示,如何应对长寿时代带来的机遇和挑战,是实施健康
2025-04-09 15:41:00
更多关于科技的资讯:
沐曦发布首款全国产通用GPU芯片“中国芯”,浦口造□南京日报/紫金山新闻记者肖凡 通讯员吴晓倩IP设计、晶圆制造、封装测试全流程国内生产
2025-10-23 07:46:00
10月22日从中北大学获悉,第十九届“挑战杯”全国大学生课外学术科技作品竞赛2025年度中国青年科技创新“揭榜挂帅”擂台赛日前在全国各地拉开帷幕
2025-10-23 07:49:00
聚焦雄安新区|首颗“雄安造”卫星完成生产下线
雄安新区空天信息产业从布局迈向实质性产出阶段首颗“雄安造”卫星完成生产下线河北日报讯(记者解丽达、曹铮 见习记者李畅)10月22日
2025-10-23 07:55:00
10月22日,安平国际会展中心。当天开幕的第25届中国·安平国际丝网博览会,用满场的“智造”活力,改写着人们对丝网的老印象
2025-10-23 07:59:00
试水市场化,VR博览会迸发新活力
会展作为经济发展的“晴雨表”和“风向标”,不仅是经济发展的助推器,更是展示经济活力的重要窗口。如今,世界VR产业大会成为南昌乃至江西的一张名片
2025-10-23 06:29:00
AI赋能医院病案内涵质量提升
鲁网10月22日讯(记者 魏萱)为深入推进健康中国建设,进一步深化医药卫生体制改革,全面提升医疗质量安全水平,建设有特色的医疗质量管理体系
2025-10-22 14:27:00
胡海建眼中的“末端决胜论”,跨越速运陆运体系如何做到“快、准、稳”?
在跨越速运的“陆空协同”运力体系中,陆运网络是连接航空枢纽与客户的关键环节。董事长胡海建深知,末端服务的“最后一公里”直接影响客户体验
2025-10-22 14:37:00
布蕾克咖啡携\
近日,布蕾克咖啡携新品「云南有机瑰夏礼盒」等多款咖啡产品登陆高端超市品牌Ole'精品超市,通过优质渠道将高品质咖啡呈现给广大咖啡爱好者
2025-10-22 14:37:00
AI驱动 数据赋能丨浪潮云领跑中国城市可信数据空间市场
近日,艾瑞咨询正式发布《2025年中国城市可信数据空间行业研究报告》,从城市可信数据空间的发展驱动因素和核心价值出发,对其总体架构
2025-10-22 17:06:00
AI赋能行业高质量发展,浪潮软件集团携线缆AI智能装备亮相华北电线电缆工业展
10月16日至18日,2025第三届华北(宁晋)电线电缆工业及材料设备展览会在河北宁晋成功举办。宁晋被誉为“中国电线电缆之乡”
2025-10-22 17:07:00
智慧兴港,科技领航:浪潮赋能港航数智化实践
近年来,我国高度重视信息化建设,先后出台多个指导意见,明确提出推动港航系统数字化转型智能化升级。在政策引领与技术创新双轮驱动下
2025-10-22 17:07:00
华为鸿蒙操作系统 6支持与Mac电脑及iPhone互传文件
10月22日14:30,华为正式推出鸿蒙操作系统6(HarmonyOS 6)。这意味着,“纯血鸿蒙”在经历“鸿蒙星河版”
2025-10-22 17:07:00
汕头企业深耕“一带一路” 艾德文制衣携转型新品再拓中东市场
2025年海湾地区国际B2B时尚贸易采购展(20周年特别版)即将开幕,这场聚焦全球时尚供应链对接的行业盛会将于11月17日-19日在迪拜世界贸易中心6号
2025-10-22 17:09:00
2025六大麦角硫因品牌榜单更新,成分筛查 + 安全适配性硬核对比
当《Nature》2024年特刊将麦角硫因(EGT)定义为 “21 世纪最具颠覆性的抗衰成分”,新加坡国立大学医院、美国国立衰老研究院等权威机构的临床数据进一步证实
2025-10-22 17:12:00
DCF智能商城:信息透明,让选择变得轻松
在信息越来越快的时代,DCF智能商城做了一件看似简单却非常重要的事——让商户和消费者之间的距离更近,让每一次交易都更有温度
2025-10-22 17:13:00