• 我的订阅
  • 科技

商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单

类别:科技 发布时间:2024-10-14 13:34:00 来源:雷峰网

在这个金秋,“日日新·商量”又拿了金牌!

今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:

商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。

商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单

商量多模态大模型API入口(限时免费!):https://platform.sensenova.cn/doc?path=/model/mllm.md

商汤“商量”注册体验链接:https://chat.sensetime.com/

凭借其卓越的多模态基础能力和出色的应用能力,商汤SenseChat-Vision 5.5荣获了总分73.56的高分,并在数理逻辑维度取得第一,体现其强大的推理能力。

SenseChat-Vision5.5基础能力突出,数理逻辑维度超越GPT-4o

本次SuperCLUE-V涵盖了国内外最具代表性的11个开源/闭源多模态理解大模型,聚焦多维度能力评估,包括基础能力和应用能力两个大方向,以开放式问题形式对多模态大模型进行评估,涵盖了8个一级维度30个二级维度。

报告称SenseChat-Vision 5.5在基础能力-数理逻辑推理任务如图表推理、场景推理方面具备领先优势。榜单显示,在数理逻辑分析能力中,SenseChat-Vision 5.5超越国内外所有参评模型包括GPT-4o的最新版本,位列第一。

商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单

商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单

SuperCLUE-V采用细粒度评估方式,构建专用测评集,每个维度进行细粒度的评估并可以提供详细的反馈信息,以下为SenseChat-Vision 5.5测试案例部分呈现:

商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单

商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单

商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单

目前,多模态大模型能力显著提升,可提供纯语言、多图理解、语音、文生图、拟人、端侧模拟、行业模型等多模态、多版本、强场景Agent形态。

前瞻构造高阶思维逻辑数据,用推理能力增强AI大模型智能

如今,复杂推理成为各模型之间的重要能力壁垒。对于大模型能力的分层,商汤科技董事长兼首席执行官徐立博士此前就提出三层架构(KRE)理论,即:第一层知识(Knowledge),世界知识的全面灌注;第二层推理(Reasoning),理性思维的质变提升;第三层执行(Execution),世界内容的互动变革。

商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单

这三层可以组成一个对于世界提供生产力工具模型的完备能力,其中提升基础模型的推理能力是目前人工智能发展的大方向。徐立博士还提出在垂直行业里如何构造高阶思维逻辑的合成数据,也是制胜关键。

今年7月发布的“日日新5.5”大模型体系就创新使用大量使用合成高阶思维链数据,提升推理思维能力,在数理逻辑、英文、指令跟随等方面能力增强明显,2个多月的时间把基模型的能力提升了30%。

未来,商汤科技将继续坚持基础大模型的持续研发与投入,前瞻探索最先进的大模型技术,突破数据与算力的限制,引领大模型的创新与落地。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-10-14 15:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新
2023-03-15 13:30:00
商汤科技sensetime推出“云端边”全栈大模型体系
2024年4月23日,上海——商汤科技SenseTime举办技术交流日活动,发布行业首个“云、端、边”全栈大模型产品矩阵
2024-04-25 01:02:00
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣味推理问题。4月23日,在202
2024-04-24 09:32:00
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
...昌均在ChatGPT引发的大模型和生成式AI热潮下,国内AI公司商汤科技也秀出自家肌肉。在4月10日下午的技术交流日上
2023-04-14 14:00:00
商汤营收恢复增长,亏损收窄至43亿元;CEO徐立回应DeepSeek影响
...狐科技作者 | 梁昌均编辑 | 杨锦转型布局大模型近两年的商汤交出了最新成绩单。商汤发布的2024年财报显示,去年实现营收37
2025-03-27 14:51:00
2024北京国际车展|加速智能汽车驶入AGI时代 商汤绝影系列原生态大模型亮相
4月25日,商汤绝影携系列原生态大模型及相关产品矩阵首次亮相2024北京国际车展。作为首个提出感知决策一体化自动驾驶通用模型的公司,商汤绝影在本届车展上首次向公众展示面向量产的真
2024-04-28 21:29:00
商汤日日新大模型体系更迭升级,金融、医疗等行业场景落地已超20个|WAIC 2023
今年6月拍摄的商汤大模型产品商量SenseChat界面(来源:钛媒体App编辑拍摄)时隔仅3个月,商汤“日日新”AI大模型正式更新
2023-07-11 13:00:00
商汤科技:创新驱动,赋能多行业发展新活力
...代,人工智能无疑是推动各行业变革与进步的核心力量。商汤科技作为人工智能领域的杰出代表,凭借其持续的创新精神与卓越的技术实力,在多个行业中发挥着重要作用,为行业发展注入新的活力
2025-07-17 21:16:00
商汤大模型落地智能汽车,“车舱大脑”可拟人化交互
商汤大模型落地智能汽车,“车舱大脑”可拟人化交互 “智能汽车是AGI(通用人工智能)实现闭环的理想场景,希望车和AI模型之间产生更多有效互动,完成从人到车到AI模型的互动闭环,让
2023-08-27 15:01:00
更多关于科技的资讯:
记者今天(2月10日)了解到,市场监管总局(国家标准委)批准发布一批重要国家标准。在新兴领域方面,发布脑机接口、数字孪生等5项国家标准
2026-02-10 14:15:00
滨州移动科技赋能年货盛会 铸就网络保障新典范
鲁网2月10日讯2026年2月6日至8日,“购在中国·2026滨州迎新春消费季暨乐购滨州年货大集”在滨州市全民健康文化中心体育场南广场盛大举办
2026-02-10 15:09:00
西北工业大学科研团队在脑机接口关键领域取得新突破
想象一下,当瘫痪者用意念操控机械臂,稳稳端起水杯;当失语者的思维被直接“翻译”成流畅语音;当帕金森患者的颤抖经神经调控逐渐平息……这些曾出现在科幻电影里的场景
2026-02-10 16:06:00
创新潮涌!温州乐清科技创新指数连续八年领跑全省
日前,位于温州乐清北白象镇中方智能园区的温州合力自动化仪表有限公司,成功研发出AI智能物联直行程电动执行器。作为流体控制领域的领军企业
2026-02-10 16:20:00
诺特兰德公益创新获认可,一举摘得公益节三项荣誉
鲁网2月10日讯1月22日至23日,第十五届公益节暨2025ESG影响力年会在北京举行。全球膳食营养品牌诺特兰德凭借其在公益领域的持续深耕与创新实践
2026-02-10 16:22:00
中国消费者报重庆讯(记者刘文新)2月6日,重庆举行低空经济重大成果发布会,发布《重庆市低空装备产业链产品名录》(2025版)
2026-02-10 16:03:00
中交一航局二公司检测中心研发一款基于若依结构的档案管理系统
鲁网2月10日讯近日,中交一航局二公司检测中心研发一款基于若依结构的档案管理系统,该系统依托若依架构精准破解行业痛点,集成RBAC权限管控
2026-02-10 15:09:00
量子技术赋能电网 安徽筑牢民生用电安全线
大皖新闻讯 今年1月,国内首个量子智慧台区在马鞍山市当涂县乌溪镇七房村正式投运。这是我国首次将量子技术与柔性互联技术规模化应用于乡村电网
2026-02-10 11:19:00
荣事达空气炸锅:温度旋钮仅为装饰 官网竟跳赌博网站
鲁网2月9日讯近日,鲁网记者收到网友关于荣事达空气炸锅的投诉。记者在抖音等社交平台看到,有关“荣事达空气炸锅调节温度的旋钮是假的”的消息在网上引发热议
2026-02-10 08:11:00
河北新闻网讯(吴萌、王冠喜)近日,在开滦集团钱家营矿业公司(简称“开滦钱矿公司”)1351工作面,一线工作20多年的老班长刘金华谈起新采用的单元支架时感触颇深
2026-02-10 09:41:00
在东阳横店,一套月租1200元的三室一厅里,藏着中国动画行业一股不可忽视的新生力量。这里没有庞大的制作团队,只有4位核心成员
2026-02-10 09:29:00
画里有话|别让专利造假侵蚀创新生态
图/沈海涛 文/王 琦如今,一条成熟的专利造假产业链正在暗中滋生蔓延:部分专利代理机构以几百元起的低价,提供从无到有的专利全程编造服务
2026-02-10 08:07:00
走市场 看消费|直播与即时零售发力,电商销售火热
借力互联网 线上赶年集直播与即时零售发力,电商销售火热2月3日,在大名县“一品一播”产业园直播间,主播齐美冉正在直播带货
2026-02-10 08:08:00
奋进的河北·数读新变化|政策加力,以旧换新激发市场潜能
政策加力,以旧换新激发市场潜能——2025年全省社会消费品零售总额增速缘何位居全国第二(一)制图/褚林一份亮眼的消费“成绩单”
2026-02-10 08:09:00
人形机器人将再次登上春晚、四足机器人穿梭写字楼送咖啡、养老机器人上门为老人送餐送药……具身智能产业加速奔跑,近日,杭州具身智能应用中试基地产业委员会筹备会举行
2026-02-10 06:56:00