• 我的订阅
  • 科技

华中科技大学白翔教授发布多模态大模型

类别:科技 发布时间:2023-12-15 01:14:00 来源:浅语科技

12月14日消息,据华中科技大学消息,近日,华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。

华中科技大学白翔教授发布多模态大模型

▲图源Monkey项目的GitHub页面

IT之家注:多模态大模型是一类可以同时处理和整合多种感知数据(例如文本、图像、音频等)的AI架构。

据介绍,Monkey模型在18个数据集上的实验中表现出色,特别是在图像描述和视觉问答任务方面,超越了众多现有知名的模型如微软的LLAVA、谷歌的PALM-E、阿里的Mplug-owl等。此外,Monkey在文本密集的问答任务中显示出“显著的优势”,甚至在某些样本上超越了业界公认的领先者——OpenAI的多模态大模型GPT-4V。

华中科技大学白翔教授发布多模态大模型

Monkey的一个显著特点是“看图说话”能力。在详细描述任务中,Monkey展现了对图像细节的感知能力,能够察觉到其他多模态大模型所忽略的内容。如对下图进行的文本描述中,Monkey正确地将其识别为埃菲尔铁塔的绘画,并提供了构图和配色方案的详细描述。而对左下角的文字,只有Monkey和GPT-4V能将其准确地识别为作者名。

华中科技大学白翔教授发布多模态大模型

Monkey号称能够利用现有的工具构建一种多层级的描述生成方法,即通过五个步骤依次对图片进行整体简述、空间定位、模块化识别、描述赋分选取和最终总结,此举可以充分结合不同工具的特性,提升描述的准确性和丰富程度。

华中科技大学白翔教授发布多模态大模型

“一个个工具就好比不同的零件,合理的排列组合才能使其发挥最大作用,”白翔教授说,“我们团队从2003年开始便从事图像识别研究,去年我们又从海外引进了专攻多模态大模型的青年人才,Monkey的最终方案是大家一起反复讨论,尝试了10余种方案后最终确定的。”白翔教授说。

Monkey的另一亮点是能够处理分辨率最高1344×896像素的图像,这是目前其他多模态大模型所能处理的最大尺寸的6倍,这意味着Monkey能对更大尺寸的图片进行更准确、丰富、细致的描述甚至推理。

Monkey多模态大模型代码目前已在GitHub开源。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-12-15 05:45:22

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...荣嵘、中国人民大学高瓴人工智能学院助理教授李崇轩、华中科技大学电信学院教授王兴刚、中山大学教授林倞等授课。课程内容包括《语言基础模型的重要特性》《视觉大模型:自监督预训练以及
2023-09-24 07:09:00
中新网武汉8月7日电 (常宇)据华中科技大学同济医学院附属同济医院7日消息,该院消化内科程斌教授团队开发了一款针对胰腺肿瘤诊断的多模态AI模型,可基于患者的临床信息与超声内镜图片
2024-08-07 13:45:00
西云算力举办AIGC沙龙,CTO梁峰分享“全系列全场景智算基础设施”
...人工智能产业发展。本期参会嘉宾介绍梁峰 西云算力CTO华中科技大学硕士学位,12年腾讯工作经历,其中10年专注于腾讯视频技术研发,随后投身于 GPU 云计算创业,担任 CTO
2024-04-15 19:00:00
华科大首次为本科生设立自然科学创新基金,入选项目将最高获得5万元科研经费
...了具有四个独立通道的复振幅波导全息成像”……近日,华中科技大学西五教学楼里,一场由本科生主导的“头脑风暴”火热上演,5个组别、63个项目,他们角逐的是20个首届“2024年度
2024-07-13 09:40:00
聚焦“数智创新 AI未来” :2023数据与存储峰会圆满落幕
...机遇。中国计算机行业协会信息存储与安全专委会会长、华中科技大学武汉光电国家研究中心教授 谢长生数据的爆发式增长,让中国计算机行业协会信息存储与安全专委会会长、华中科技大学武汉
2023-11-30 11:48:00
中国多所高校接入Deep Seek大模型
...守学术伦理规范,避免误用、滥用带来的科研诚信风险。华中科技大学计算机科学与技术学院教授魏巍认为,人机协同将是大势所趋。对高校而言,可通过增设AI相关课程,帮助师生更好地提高A
2025-02-21 17:17:00
华中师大一附中与华中科技大学携手推出“数字人项目” 共育未来世界的引领者
...范大学第一附属中学(以下简称“华中师大一附中”)与华中科技大学携手合作,用创新实践给出了有力回答。4月19日,双方共建的“数字人项目”正式亮相,展现了基础教育与高等教育在拔尖
2025-04-22 10:38:00
...200人,其中产研人员占比达80%。金山办公还与武汉大学、华中科技大学等多所一流高校签订校企合作协议,助力产学研一体化发展。未来,金山办公将在武汉将持续加大研发投入,将武汉打
2023-09-21 16:20:00
2025长寿时代论坛在武汉举办
...老需求大幅增长,大健康产业的发展步入了“快车道”。华中科技大学同济医学院附属同济医院党委副书记、院长、第二临床学院院长胡俊波表示,如何应对长寿时代带来的机遇和挑战,是实施健康
2025-04-09 15:41:00
更多关于科技的资讯:
■赵磊摘要:随着人工智能技术在营销领域的广泛应用,品牌内容生成方式正发生深刻变革。基于人工智能的内容生成工具,能够在短时间内大规模生产多样化的品牌传播内容
2026-02-28 04:57:00
随着新一轮科技革命与产业变革的深入推进,人工智能、大数据、元宇宙等数字技术的快速发展,正在深刻重塑人们的生产模式与日常生活方式
2026-02-28 04:57:00
■王晓静摘要:随着数字平台在服务业中的广泛渗透,医疗美容行业逐渐由以单体机构为中心的线下运营模式,转向以平台为枢纽的网络化运营结构
2026-02-28 04:57:00
具身智能“百亿俱乐部”崛起 河南凭啥成为下一个重仓地?
大河网讯 当中国具身智能领域迎来爆发式增长,以银河通用、智元机器人、宇树科技、千寻智能、星海图、智平方等企业组成的“百亿俱乐部”强势崛起
2026-02-27 20:11:00
大皖新闻讯 2026年春节档,电影《飞驰人生3》以超30亿元的票房成绩,再次展现了赛车题材电影的市场号召力。影片中,张弛与对手在虚构的“巴音布鲁克”赛道上展开对决
2026-02-27 20:31:00
宇太能源与大型储能企业开展项目合作
近日,广东宇太能源与某大型新能源企业签订协议,双方共同推进空微子发电技术在储能领域的深度应用。据悉,该新能源公司为储能电站领域的民营龙头企业
2026-02-27 21:20:00
当手机里的AI助手开始帮长辈点外卖、订年货,当家族群里的拜年视频由AI一键生成,当独居的父母对着智能设备练朗诵、聊家常
2026-02-27 21:51:00
消费有惊喜,发票变“红包”。继“即时开奖”的最高奖98元、“每周定期开奖”的最高奖800元之后,我市“有奖发票”活动中的最大奖项来了
2026-02-27 21:59:00
在我国平台经济持续壮大的背景下,新就业形态劳动者规模不断扩张,新兴职业加速涌现,已成为推动实现高质量充分就业战略目标的重要力量
2026-02-27 22:00:00
谨以杭州之名呼唤德国
2月26日,德国总理默茨专机抵达杭州。在杭州萧山机场,迎接他的是一辆黑色红旗轿车。随行的约30家企业高管,覆盖了拜耳、大众
2026-02-27 18:02:00
中国消费者报北京讯(记者孙蔚)2月26日,爱奇艺发布的最新财报显示,2025年总收入272.9亿元,Non-GAAP(非美国通用会计准则)运营利润6
2026-02-27 17:06:00
中国消费者报报道(记者张文章)在福建一些企业的研发实验室与生产车间里,常能看到一些特殊的身影,他们是福建省知识产权保护中心(以下简称福建保护中心)派出的首席质量服务官和科技特派员服务团队
2026-02-27 17:06:00
中国消费者报福州讯(记者张文章)2月26日,记者从福建省漳州市市场监管局获悉,国家药监局药品评价中心、国家药品不良反应监测中心近日印发《关于表扬2025年全国药械妆不良反应监测评价工作表现突出单位的通报》
2026-02-27 17:06:00
中国消费者报南昌讯(严有生 记者朱海)2月27日,记者从江西省市场监管局获悉,市场监管总局近日正式批准在江西省上饶市筹建国家高精密光学元件产品质量检验检测中心
2026-02-27 17:06:00
中国消费者报福州讯(记者张文章)2月26日,福建省商务厅、省市场监管局等5部门联合印发《福建省2026年家电以旧换新、数码和智能产品购新补贴实施细则》(以下简称《细则》)
2026-02-27 17:06:00