• 我的订阅
  • 科技

击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三

类别:科技 发布时间:2024-06-29 09:36:00 来源:机器之心Pro

机器之心报道

机器之心编辑部

近日,云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。

最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻身全球前三,超越了谷歌的 Gemini-1.5-Pro 和 GPT-4v,仅次于 GPT-4o(69.9)和 Claude3.5-Sonnet(67.9)。

而在国内市场,从容大模型的成绩也超过了 InternVL-Chat(61.7)和 GLM-4V(60.8),排名首位。

击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三

图 1:OpenCompass 多模态榜单

OpenCompass 大模型开放评测体系是上海人工智能实验室推出的完整开源可复现的评测框架。OpenCompass 多模态评测方面采用了 8 个具有代表性的数据集,从多种视角客观量化多模态大模型的能力,评估维度覆盖目标检测、文字识别、动作识别、图像理解和关系推理、艺术与设计、商业、科学、健康与医学、人文与社会科学、技术与工程、数学推理等多个方面。

击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三

图 2:从容大模型 - 2.0 多模态能力示例

在本次测评中,从容大模型在其中的 6 个数据集表现优异,排名国内第一(MMbench、MMStar、MathVista、HallusionBench、AI2D、OCRBench),尤其是在 OCRBench 测试集上以取得全球最高的 827 分(总分为 1000 分),且高于第二名 GLM-4v 13 分,进一步提升从容大模型在文本识别、以文本为中心的视觉问答、面向文档的视觉问答、关键信息提取等业务场景下的适用性。

击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三

图 3:OpenCompass 中国大模型能力展示

从容大模型在此体系中的优秀表现,依赖云从科技自研的高效多模态处理架构和先进的计算技术,实现了高效的多模态数据处理能力,能够在视觉和语言任务之间实现高效的融合和切换,并最大化利用计算资源,保证在处理大规模多模态数据时仍能保持较高的性能和响应速度,使得模型的训练过程更加高效,收敛速度更快,性能更稳定。

同时也得益于云从科技长期在视觉、语言领域的深厚积累和不断创新。

击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三

图 4:从容大模型 - 2.0 多模态能力示例

此前,从容大模型已在视觉、跨模态领域 10 次刷新世界纪录,综合性能经第三方 SuperClue、C-Eval 等综合评测,位列全球前五。

作为一家专注于人机协同技术研发的平台企业,云从科技一直在积极推动 AI 智能体及大模型技术的发展和应用。

随着人工智能技术的迅猛发展,多模态大模型已成为驱动产业变革的核心引擎。此次从容大模型在 OpenCompass 大模型开放评测体系中的出色表现,不仅是对云从科技技术创新实力的认可,更在业界树立典范,激励全球科技企业在新一轮的人工智能竞争中勇攀高峰。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-29 12:45:21

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

云从科技从容大模型荣登中国大模型第一梯队
...有力证明。 云从科技在综合评测权威平台OpenCompass的多模态评测领域中也取得了重大进展。最新评测结果显示
2024-08-09 15:00:00
训练数据超20亿 云从科技视觉大模型刷新四项世界纪录
...水平,也意味着计算机视觉已经迈入「大模型时代」。多模态结合自监督学习 打造全球领先核心技术以人为中心的感知任务,一直是人工智能领域研究的热点,大模型具有强大的表征能力,并且在
2023-07-22 01:00:00
2025腾讯全球数字生态大会:腾讯云互联网行业“云+AI”全栈产品,加速行业AI应用落地
...智能体开发平台、混元大模型,到图文、语音、视频等多模态处理能力,均已形成标准化能力封装,企业可基于RAG、Workflow与Agent框架快速构建专属智能体,嵌入旅游规划、内
2025-09-17 14:25:00
紫东.太初再进化,揭秘全模态大模型的想象力
...在演讲中介绍了基于昇腾AI与昇思MindSpore AI框架打造的全模态大模型紫东.太初2.0,并首次提出全模态多任务统一生成式学习框架
2023-05-12 06:00:00
无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-Omni
...,无问芯穹今日宣布,开源无问芯穹端侧解决方案中的全模态理解小模型 Megrez-3B-Omni 和它的纯语言模型版本 Megrez-3B-Instruct
2024-12-17 09:24:00
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和
2024-03-14 15:12:00
东方证券:谷歌发布多模态模型Gemini,多模态应用前景广阔
...办公、法律、医疗有望率先落地。东方证券:谷歌发布多模态模型Gemini,多模态应用前景广阔12月6日晚,谷歌正式发布了Gemini大模型
2023-12-11 19:30:00
阶跃星辰宣布开源图生视频模型,多模态领域的DeepSeek时刻何时来?
...开源大模型DeepSeek走红,AI社区开发者也开始探讨,在多模态领域能否出现这样强大的模型。有着多模态领域深厚积累的阶跃星辰选择为开源贡献自己的力量,首次进行了模型开源。在
2025-02-22 16:36:00
平安产险在ICDAR2025国际多模态理解竞赛中强势夺冠,连续4年荣获国际顶尖赛事冠军!
...世界顶级赛事中,平安产险(参赛团队名称PA-VCG)在“多模态文档推理理解”这一高复杂度任务中,凭借领先的大模型技术体系与卓越的多模态理解能力,从全球众多顶尖科研机构与知名科
2025-06-17 17:47:00
更多关于科技的资讯:
“世界舞台”上秀一圈,南京收获了什么?
进博会圆满落幕,南京交易分团意向成交9.98亿美元“世界舞台”上秀一圈,南京收获了什么?□南京日报/紫金山新闻记者 黄琳燕11月10日
2025-11-14 08:38:00
埃斯顿工业机器人出货量持续增长 宁企连续三季霸榜国内“一哥”
11月13日,在江宁开发区埃斯顿智能制造示范车间内,工业机器人正在做各种场景应用展示。宁企埃斯顿今年前三季度机器人总销量约25000台
2025-11-14 08:39:00
一批创新产品亮相“宁创新品”信创产业教育专场活动 只需3步,20分钟完成全班作业批改南报网讯(记者徐宁)上传空白试卷和答案
2025-11-14 08:39:00
以AI引擎打造数字化转型山西模式
图片由讲述人提供讲述人 山西数据流量谷副总经理邵同旭我是山西数据流量谷的邵同旭,长期专注于数据要素与人工智能领域。多年来
2025-11-14 08:52:00
岁末是金融服务的“大考期”,业务量激增、客户需求多元叠加。张家口农商银行宣泰支行聚焦柜面运营核心环节,以“压降投诉、提升质量
2025-11-14 10:07:00
秋实如今,快节奏的都市生活中,“情绪消费”成为一种新的消费方式。数据显示,超九成青年认可情绪价值,近六成青年愿意为情绪价值买单
2025-11-14 11:28:00
新华社记者王雨萧周蕊一杯咖啡,能勾勒出怎样的经济图景?从云南绵延百万余亩的咖啡种植园,到上海梧桐树下香气氤氲的创意特调
2025-11-14 11:28:00
惠依近日,深圳大学深圳城市传播创新研究中心发布《短视频用户的算法实践与“破茧”报告》。《报告》显示,与一些人担忧“信息茧房”形成对比
2025-11-14 11:28:00
如新荣获2025消费责任对话活动客户服务创新典型案例
2025年11月5日,以“大力提振消费 品质服务担当”为主题的消费责任对话活动在成都成功举办。本次活动由中国消费者协会
2025-11-14 11:29:00
Shopee 11.11大促热力爆棚,Shopee Live直播开场4分钟即售出1100万件商品
2025年11月13日,中国 —— 近日,东南亚及巴西领航电商平台Shopee 11.11大促再掀购物狂潮,Shopee Live直播开场4分钟即售出1100万件商品
2025-11-14 11:31:00
风暴来袭!先优食品推出以“樱花炸鸡“为核心的四大天王系列炸鸡,引爆味觉新革命
当颜值经济邂逅味觉升级,以创新研发与品质制造为核心优势的青岛先优食品有限公司,重磅推出以“樱花炸鸡“为核心的四大天王系列炸鸡战略级产品
2025-11-14 11:32:00
招商创科携手凯赛生物推动生物基材料应用 助力纺织产业绿色升级
在科技创新成为国家发展战略核心的背景下,招商局集团积极推进“第三次创业”,通过旗下招商创科、招商积余到家汇平台,联合生物制造企业凯赛生物
2025-11-14 11:32:00
佳人与银都拉玛集团成立合资公司 共推全球纺织行业循环发展
曼谷(泰国)/浙江(中国)——2025年11月11日——全球领先的再生聚酯纤维、纱线及技术纺织品供应商银都拉玛集团(Indorama Ventures)纤维业务部
2025-11-14 11:32:00
凡泰极客FinClip ChatKit:破解金融AI落地困局,实现“对话就能办业务”
在金融行业数字化转型的浪潮中,AI技术的崛起正以前所未有的速度重塑着业务逻辑与技术架构。从颠覆传统风控的智能大脑,到赋能普惠金融的智能投顾
2025-11-14 11:33:00
AI视觉重塑质检“智慧之眼”,聚焦四大核心应用场景
当前,AI视觉质检技术正以“精准化、场景化、智能化”为核心驱动力,推动测试测量领域从传统人工/2D检测向“3D全维度+AI深度赋能”跨越式升级
2025-11-14 11:33:00