• 我的订阅
  • 科技

华中科技大学白翔教授发布多模态大模型

类别:科技 发布时间:2023-12-15 01:14:00 来源:浅语科技

12月14日消息,据华中科技大学消息,近日,华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。

华中科技大学白翔教授发布多模态大模型

▲图源Monkey项目的GitHub页面

IT之家注:多模态大模型是一类可以同时处理和整合多种感知数据(例如文本、图像、音频等)的AI架构。

据介绍,Monkey模型在18个数据集上的实验中表现出色,特别是在图像描述和视觉问答任务方面,超越了众多现有知名的模型如微软的LLAVA、谷歌的PALM-E、阿里的Mplug-owl等。此外,Monkey在文本密集的问答任务中显示出“显著的优势”,甚至在某些样本上超越了业界公认的领先者——OpenAI的多模态大模型GPT-4V。

华中科技大学白翔教授发布多模态大模型

Monkey的一个显著特点是“看图说话”能力。在详细描述任务中,Monkey展现了对图像细节的感知能力,能够察觉到其他多模态大模型所忽略的内容。如对下图进行的文本描述中,Monkey正确地将其识别为埃菲尔铁塔的绘画,并提供了构图和配色方案的详细描述。而对左下角的文字,只有Monkey和GPT-4V能将其准确地识别为作者名。

华中科技大学白翔教授发布多模态大模型

Monkey号称能够利用现有的工具构建一种多层级的描述生成方法,即通过五个步骤依次对图片进行整体简述、空间定位、模块化识别、描述赋分选取和最终总结,此举可以充分结合不同工具的特性,提升描述的准确性和丰富程度。

华中科技大学白翔教授发布多模态大模型

“一个个工具就好比不同的零件,合理的排列组合才能使其发挥最大作用,”白翔教授说,“我们团队从2003年开始便从事图像识别研究,去年我们又从海外引进了专攻多模态大模型的青年人才,Monkey的最终方案是大家一起反复讨论,尝试了10余种方案后最终确定的。”白翔教授说。

Monkey的另一亮点是能够处理分辨率最高1344×896像素的图像,这是目前其他多模态大模型所能处理的最大尺寸的6倍,这意味着Monkey能对更大尺寸的图片进行更准确、丰富、细致的描述甚至推理。

Monkey多模态大模型代码目前已在GitHub开源。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-12-15 05:45:22

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...荣嵘、中国人民大学高瓴人工智能学院助理教授李崇轩、华中科技大学电信学院教授王兴刚、中山大学教授林倞等授课。课程内容包括《语言基础模型的重要特性》《视觉大模型:自监督预训练以及
2023-09-24 07:09:00
中新网武汉8月7日电 (常宇)据华中科技大学同济医学院附属同济医院7日消息,该院消化内科程斌教授团队开发了一款针对胰腺肿瘤诊断的多模态AI模型,可基于患者的临床信息与超声内镜图片
2024-08-07 13:45:00
西云算力举办AIGC沙龙,CTO梁峰分享“全系列全场景智算基础设施”
...人工智能产业发展。本期参会嘉宾介绍梁峰 西云算力CTO华中科技大学硕士学位,12年腾讯工作经历,其中10年专注于腾讯视频技术研发,随后投身于 GPU 云计算创业,担任 CTO
2024-04-15 19:00:00
华科大首次为本科生设立自然科学创新基金,入选项目将最高获得5万元科研经费
...了具有四个独立通道的复振幅波导全息成像”……近日,华中科技大学西五教学楼里,一场由本科生主导的“头脑风暴”火热上演,5个组别、63个项目,他们角逐的是20个首届“2024年度
2024-07-13 09:40:00
聚焦“数智创新 AI未来” :2023数据与存储峰会圆满落幕
...机遇。中国计算机行业协会信息存储与安全专委会会长、华中科技大学武汉光电国家研究中心教授 谢长生数据的爆发式增长,让中国计算机行业协会信息存储与安全专委会会长、华中科技大学武汉
2023-11-30 11:48:00
中国多所高校接入Deep Seek大模型
...守学术伦理规范,避免误用、滥用带来的科研诚信风险。华中科技大学计算机科学与技术学院教授魏巍认为,人机协同将是大势所趋。对高校而言,可通过增设AI相关课程,帮助师生更好地提高A
2025-02-21 17:17:00
华中师大一附中与华中科技大学携手推出“数字人项目” 共育未来世界的引领者
...范大学第一附属中学(以下简称“华中师大一附中”)与华中科技大学携手合作,用创新实践给出了有力回答。4月19日,双方共建的“数字人项目”正式亮相,展现了基础教育与高等教育在拔尖
2025-04-22 10:38:00
...200人,其中产研人员占比达80%。金山办公还与武汉大学、华中科技大学等多所一流高校签订校企合作协议,助力产学研一体化发展。未来,金山办公将在武汉将持续加大研发投入,将武汉打
2023-09-21 16:20:00
2025长寿时代论坛在武汉举办
...老需求大幅增长,大健康产业的发展步入了“快车道”。华中科技大学同济医学院附属同济医院党委副书记、院长、第二临床学院院长胡俊波表示,如何应对长寿时代带来的机遇和挑战,是实施健康
2025-04-09 15:41:00
更多关于科技的资讯:
7×24小时自主巡检,杭州萧山机场添智能驱鸟装备
在航空运输业快速发展的今天,机场安全运行始终是行业关注的重点。鸟类撞击飞机的事件虽不常见,但一旦发生,可能对飞机引擎、机身结构造成损害
2025-11-18 10:47:00
“产业炬光灯”聚焦元之道生物科技
“产业炬光灯”聚焦厦门元之道生物科技有限公司。扫码看视频厦门网讯(厦门日报记者 李晓平)小小微生物,蕴藏着改变健康的大能量
2025-11-18 09:03:00
“安徽省电竞产业研究合作基地”聘任10名顾问
大皖新闻讯 2025年11月16日,安徽电竞创新发展大会在合肥举行。汇聚来自政府部门、行业协会、知名企业及高校的众多嘉宾
2025-11-17 09:24:00
为进一步提升网点服务能力与柜员专业素养,夯实业务基础,打造有温度的金融服务,近日,邮储银行唐山市分行组织开展了“星暖燕赵 星星闪耀”星级柜员竞赛活动
2025-11-17 10:07:00
张家口农商银行宣泰支行打破传统服务边界,以“线上服务提质、直播互动破圈、短视频赋能”为抓手,将便捷与温度融入数字金融场景
2025-11-17 10:11:00
阿里全力进军AI to C市场 千问APP上线公测
11月17日,阿里巴巴正式宣布“千问”项目,全力进军AI to C市场。当天,千问APP公测版上线,基于全球性能第一的开源模型Qwen3
2025-11-17 11:08:00
中新经纬11月17日电 据韩联社报道,三星集团将在未来五年对本土科学研究与试验发展等领域共投资450万亿韩元(约合人民币2
2025-11-17 11:48:00
近日,南都湾财社记者注意到,因为小天才电话手表社交圈的流行,已经产生了相应的产业链——加好友、冲点赞、买“靓号”、卖“高粉”账号
2025-11-17 12:04:00
“25岁,我勇敢从大厂裸辞”“37岁年薪百万,却主动告别互联网大厂”“离开大厂两年,我活成了想要的样子”……近来,“大厂离职”话题在社交平台持续升温
2025-11-17 12:05:00
潍坊联通圆满完成2025潍坊企业家大会通信保障任务
鲁网11月17日讯在第6个潍坊市 “企业家日”到来之际,2025潍坊企业家大会于11月1日隆重召开,主会场设在富华国际会议中心
2025-11-17 14:33:00
蓝盾出击!一场与病毒的闪电战——记潍坊联通快速响应团队的72小时攻坚
鲁网11月17日讯2025年10月21日下午,一阵急促的电话铃声在某单位响起,揭开了与病毒赛跑的序幕。“系统异常!多台办公电脑感染未知病毒
2025-11-17 14:34:00
安谋科技Arm China发布“周易”X3 NPU IP,破局AI算力勾勒智能未来全景图
2025年11月13日,国内领先的芯片IP设计与服务提供商安谋科技Arm China,正式揭开了新一代NPU IP“周易”X3的神秘面纱
2025-11-17 14:35:00
凯盛浩丰集团创新人力资源管理斩获北森2025AI应用先锋奖
鲁网11月17日讯近日,凯盛浩丰集团凭借人力资源领域的AI创新实践,斩获“北森2025AI应用先锋奖”。通过将AI技术融入招聘
2025-11-17 14:35:00
2026亚洲100必打卡榜目的地!福州入选
日前,携程正式发布口碑榜2026年度榜单,福州入选“2026亚洲100目的地榜”“2026中国100目的地榜”两个榜单
2025-11-17 15:20:00
当“工业硬核”遇见“健康温度”:如新在一汽开放日奏响家企健康新乐章
鲁网11月17日讯11月15日的青岛,寒意初显,但一汽解放青岛汽车有限公司的即墨厂区内却暖流涌动。一场名为“扬帆家年华·领航新乐章”的2025员工家属开放日暨员工音乐节正在这里温情上演
2025-11-17 15:45:00