• 我的订阅
  • 科技

商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单

类别:科技 发布时间:2024-10-14 13:34:00 来源:雷峰网

在这个金秋,“日日新·商量”又拿了金牌!

今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:

商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。

商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单

商量多模态大模型API入口(限时免费!):https://platform.sensenova.cn/doc?path=/model/mllm.md

商汤“商量”注册体验链接:https://chat.sensetime.com/

凭借其卓越的多模态基础能力和出色的应用能力,商汤SenseChat-Vision 5.5荣获了总分73.56的高分,并在数理逻辑维度取得第一,体现其强大的推理能力。

SenseChat-Vision5.5基础能力突出,数理逻辑维度超越GPT-4o

本次SuperCLUE-V涵盖了国内外最具代表性的11个开源/闭源多模态理解大模型,聚焦多维度能力评估,包括基础能力和应用能力两个大方向,以开放式问题形式对多模态大模型进行评估,涵盖了8个一级维度30个二级维度。

报告称SenseChat-Vision 5.5在基础能力-数理逻辑推理任务如图表推理、场景推理方面具备领先优势。榜单显示,在数理逻辑分析能力中,SenseChat-Vision 5.5超越国内外所有参评模型包括GPT-4o的最新版本,位列第一。

商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单

商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单

SuperCLUE-V采用细粒度评估方式,构建专用测评集,每个维度进行细粒度的评估并可以提供详细的反馈信息,以下为SenseChat-Vision 5.5测试案例部分呈现:

商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单

商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单

商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单

目前,多模态大模型能力显著提升,可提供纯语言、多图理解、语音、文生图、拟人、端侧模拟、行业模型等多模态、多版本、强场景Agent形态。

前瞻构造高阶思维逻辑数据,用推理能力增强AI大模型智能

如今,复杂推理成为各模型之间的重要能力壁垒。对于大模型能力的分层,商汤科技董事长兼首席执行官徐立博士此前就提出三层架构(KRE)理论,即:第一层知识(Knowledge),世界知识的全面灌注;第二层推理(Reasoning),理性思维的质变提升;第三层执行(Execution),世界内容的互动变革。

商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单

这三层可以组成一个对于世界提供生产力工具模型的完备能力,其中提升基础模型的推理能力是目前人工智能发展的大方向。徐立博士还提出在垂直行业里如何构造高阶思维逻辑的合成数据,也是制胜关键。

今年7月发布的“日日新5.5”大模型体系就创新使用大量使用合成高阶思维链数据,提升推理思维能力,在数理逻辑、英文、指令跟随等方面能力增强明显,2个多月的时间把基模型的能力提升了30%。

未来,商汤科技将继续坚持基础大模型的持续研发与投入,前瞻探索最先进的大模型技术,突破数据与算力的限制,引领大模型的创新与落地。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-10-14 15:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新
2023-03-15 13:30:00
商汤科技sensetime推出“云端边”全栈大模型体系
2024年4月23日,上海——商汤科技SenseTime举办技术交流日活动,发布行业首个“云、端、边”全栈大模型产品矩阵
2024-04-25 01:02:00
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣味推理问题。4月23日,在202
2024-04-24 09:32:00
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
...昌均在ChatGPT引发的大模型和生成式AI热潮下,国内AI公司商汤科技也秀出自家肌肉。在4月10日下午的技术交流日上
2023-04-14 14:00:00
商汤营收恢复增长,亏损收窄至43亿元;CEO徐立回应DeepSeek影响
...狐科技作者 | 梁昌均编辑 | 杨锦转型布局大模型近两年的商汤交出了最新成绩单。商汤发布的2024年财报显示,去年实现营收37
2025-03-27 14:51:00
2024北京国际车展|加速智能汽车驶入AGI时代 商汤绝影系列原生态大模型亮相
4月25日,商汤绝影携系列原生态大模型及相关产品矩阵首次亮相2024北京国际车展。作为首个提出感知决策一体化自动驾驶通用模型的公司,商汤绝影在本届车展上首次向公众展示面向量产的真
2024-04-28 21:29:00
商汤日日新大模型体系更迭升级,金融、医疗等行业场景落地已超20个|WAIC 2023
今年6月拍摄的商汤大模型产品商量SenseChat界面(来源:钛媒体App编辑拍摄)时隔仅3个月,商汤“日日新”AI大模型正式更新
2023-07-11 13:00:00
商汤科技:创新驱动,赋能多行业发展新活力
...代,人工智能无疑是推动各行业变革与进步的核心力量。商汤科技作为人工智能领域的杰出代表,凭借其持续的创新精神与卓越的技术实力,在多个行业中发挥着重要作用,为行业发展注入新的活力
2025-07-17 21:16:00
商汤大模型落地智能汽车,“车舱大脑”可拟人化交互
商汤大模型落地智能汽车,“车舱大脑”可拟人化交互 “智能汽车是AGI(通用人工智能)实现闭环的理想场景,希望车和AI模型之间产生更多有效互动,完成从人到车到AI模型的互动闭环,让
2023-08-27 15:01:00
更多关于科技的资讯:
车联天下与AMD达成战略合作,共推智能网联汽车技术升级
全球汽车产业正加速向电动化、智能化和网联化转型,智能驾驶和车载娱乐已成为未来出行体验的重要驱动力。AI和高性能计算技术在车辆感知
2026-01-16 21:22:00
百奥赛图(688796)以基因编辑技术起家,是一家创新药临床前CRO及生物技术公司,专门为创新药企业提供抗体药物发现及临床前研发服务
2026-01-16 22:48:00
中新经纬1月16日电 16日下午,市场监管总局召开食品安全专题新闻发布会。市场监管总局食品协调司副司长母兰在发布会上称
2026-01-16 21:34:00
在生成式AI重塑信息检索范式的当下,GEO(生成式引擎优化)已从营销小众赛道跃升为企业数字化转型的核心增长引擎。据艾瑞咨询《2026 GEO行业报告》显示
2026-01-16 21:23:00
中国优秀AI企业2026年展望:AI技术迭代深化引领商业化规模化落地 全球AI产业进入技术深耕与商业化兑现双轮加速期,中国优秀AI企业迎来价值释放关键窗口
2026-01-16 17:14:00
8个省级高质量数据集、324家省级“晨星工厂” 临沂扎实筑牢“人工智能+”发展根基
鲁网1月16日讯 (记者 李文静)数据是赋能人工智能训练的原材料。1月16日上午,临沂市人民政府新闻办公室召开新闻发布会
2026-01-16 17:18:00
中新经纬1月16日电 题:中国电影IP的长期主义,还缺什么?作者 张志鹏 中国广告协会文创与IP专业委员会副主任近日,玩具制造商桑尼森迪正式递表港交所
2026-01-16 17:22:00
贾国龙最新发声:今晚10点 将就罗永浩对西贝的重大污蔑诽谤全面回应
华商网讯 1月16日,西贝贾国龙发文称,将就罗永浩对西贝的重大污蔑诽谤一一全面回应。据了解,此前,1月16日,罗永浩再次发长文回应西贝贾国龙近日言论
2026-01-16 18:46:00
第七届皖新传媒读者节全省启动
大皖新闻讯 1月17日起,以“阅见万象 奔向前程”为主题的第七届皖新传媒读者节在全省新华书店市、县门店正式拉开帷幕,活动将持续至2月1日
2026-01-16 18:55:00
双主题活动+三重深度体验,金鸡湖教育集团科技节展现赋能成长新路径
江南时报讯 当知识课堂与前沿科技相遇,当学校携手行业大咖跨界联动,金鸡湖教育集团的科技节彻底点燃了整个校园。两大主题活动
2026-01-16 17:06:00
刘典(学者)2025年春天,《杭州模式:DeepSeek与中国算谷》出版了。对我而言,一本书写完了,从来不是结束,而是带着这些思考
2026-01-16 16:56:00
时间枝头 生活向新
这些关于“具体生活”的探索与坚守,既是过往一年的珍贵注脚,更铺就了通往新岁的温暖底色。 吴卓平回顾过去这一年,杭州的文化
2026-01-16 16:56:00
苏州黄埭镇新型电力电子OPC创新社区启动
江南时报讯1月15日,位于苏州市相城区黄埭镇的新型电力电子OPC创新社区正式启动。作为相城区的工业重镇,黄埭镇拥有深厚的制造业底蕴和完善的产业链配套
2026-01-16 16:56:00
千问App大规模功能上新,实现一句话找真题、讲难题
1月15日,千问App实现大规模功能上新,支持用一句话实现超过400项任务。其中,学习领域的“办事力”显著增强,用户只需一句话即可找卷子
2026-01-16 14:00:00
Z世代购物车|排队两小时!“年轻人的十字绣”为何火热?
中新经纬1月16日电 (王玉玲)一种名为“拼豆”的手工像素画在社交平台上持续火热。在小红书上,话题“我染上了拼豆”浏览量近28亿次
2026-01-16 14:23:00