• 我的订阅
  • 财经

商汤商量获SuperCLUE 9月评测总榜和子榜两项第一,AI智能体方向受瞩目

类别:财经 发布时间:2023-10-13 14:26:00 来源:财联社

商汤商量获SuperCLUE 9月评测总榜和子榜两项第一,AI智能体方向受瞩目

近日,中文通用大模型综合性评测基准SuperCLUE发布9月总排行榜和各个分类任务榜单,商汤商量SenseChat 3.0 位列中文大模型总榜排名第一。在新增的AI Agent(AI智能体)子榜中,SenseChat 3.0 同样排名第一,领先所有国内中文大模型以及GPT-3.5 和 Claude 2,表现仅次于GPT-4,展示了商汤在大模型领域创新发展及释放生产力的优势,以及在探索AGI道路上的积累与潜力。

商汤商量获SuperCLUE 9月评测总榜和子榜两项第一,AI智能体方向受瞩目

注:国外代表性模型(GPT4.0/Claude2/gpt-3.5)不参与排名。

SuperCLUE是中文通用大模型的综合性评测基准,旨在对大模型在各个能力维度上的表现进行全方位的评估,是国内最具专业性和代表性的中文大模型评测基准之一。此次评测选取了目前国内外最具代表性的20个通用大语言模型。

商量总榜第一,客观题成绩超GPT-3.5

9月最新发布的SuperCLUE总排行榜和各个分类任务榜单,主要聚焦于大模型的四个能力象限,语言理解与生成,包括语言理解与抽取、上下文对、生成与创作、角色扮演;专业技能与知识,包括知识与百科、计算、代码、逻辑与推理;Agent智能体,包括工具使用、任务规划;安全性,包括系统安全、指令攻击,总共12项基础能力。

在总排行榜中,商汤科技商量SenseChat 3.0以总分62.75分位列第一,其中在OPT客观题部分,商汤SenseChat 3.0得分还超过了GPT-3.5,展示了在中文大模型方面极强的综合竞争力。

商汤商量SenseChat于2023年4月正式推出,是国内最早的基于千亿参数大语言模型之一,并不断迭代更新。其背后依托的是商汤AI大装置SenseCore,目前上线GPU数量约30,000块,算力规模提升至6 ExaFLOPS,有效支持语言大模型的训练、升级迭代和服务。

推动AI智能体发展,加速迈向AGI

随着大模型发展,“聊天”已远远不能满足人们的要求,能够准确使用工具成为解放大模型生产力的关键。SuperCLUE新增的AI Agent(AI智能体)子榜,是业界首个AI Agent榜单,它重点评估了AI Agent在“工具使用”和“任务规划”两个关键能力上的表现。评测显示商汤商量SenseChat 3.0具备作为人类超级助手的潜力,可以根据人类需求自主完成任务,进而充分释放大模型的生产力,使其在 AI Agent 榜单上表现仅次于GPT-4,全面领先其余参评大模型。

商汤商量获SuperCLUE 9月评测总榜和子榜两项第一,AI智能体方向受瞩目

目前全球领先的AI 智能体,几乎都以领先大模型GPT-4为核心驱动,它们借助强大的工具使用能力等,可将复杂问题拆解成可实现的子任务、类人的自然语言交互等能力。商量SenseChat 3.0作为领先的中文大模型,通过使用代码解释器、API调用和搜索三类常用工具来解决复杂任务,灵活搭建AI智能体应用,支撑企业的生产力革新。

目前,商量SenseChat已经在金融、手机、医疗、汽车、地产、能源、传媒、工业制造等众多垂直行业与超过500家客户建立了深度合作。作为具备强大工具使用能力的大模型,商量SenseChat的持续快速提升,为商汤发展更强大的、能够像人类一样进行交互的AI智能体,以及面向AGI道路的探索,都将提供重要的基础和支撑。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-10-13 18:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...青年报记者跟随“高质量发展调研行”主题采访活动来到商汤科技新洲大厦。智能自诊预测疾病风险、临床大数据治理、智能化专病随访服务……如今,越来越多未来感十足的就医新场景在上海渐次
2024-05-27 07:15:00
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新
2023-03-15 13:30:00
商汤科技sensetime推出“云端边”全栈大模型体系
2024年4月23日,上海——商汤科技SenseTime举办技术交流日活动,发布行业首个“云、端、边”全栈大模型产品矩阵
2024-04-25 01:02:00
商汤科技发布“书生·浦语”大模型 中文考试超越ChatGPT
...各业,据CNMO了解,近日,行业领先的人工智能软件公司商汤科技与上海AI实验室等发布了“书生·浦语”大模型。商汤科技据媒体报道,商汤科技、上海AI实验室联合香港中文大学、复旦
2023-06-08 00:13:00
...2.0》(以下简称报告)显示,讯飞星火、百度文心一言、商汤商量和智谱AI-ChatGLM均表现抢眼,AI大模型的发展为人类工作和生活的提质增效均带来了正向积极的影响。今年以来
2023-08-12 18:18:00
“大装置+大模型”战略:助力商汤迅速获取生成式AI商业化果实
...机会。从AI1.0向AI2.0演进,全球领先的人工智能软件公司商汤集团股份有限公司(下文简称“商汤”)成为立于潮头的那个
2024-04-01 15:16:00
...2023年中国大模型行研能力评测报告》。评测结果显示,商汤语言大模型“日日新·商量”以总分7.73(满分10分)斩获总榜第一,并在报告撰写能力、模型基础能力两个子榜位居第一。
2024-01-13 00:05:00
本文转自:劳动报商汤科技发布日日新5.0大模型五大产品全新亮相 局部能力赶超GPT-4本报讯(劳动报记者 陈宁)日前,在上海商汤临港AIDC举行的“2024年商汤技术交流日”活动
2024-04-29 04:36:00
商汤科技马堃:通用型人工智能将大幅提升生产力 元萝卜AI下棋机器人为家庭应用而生|WISE2023商业之王大会
...提问,给未来答案。在11月29日上午的WISE主会场演讲中,商汤科技联合创始人、西安电子科技大学客座教授、元罗卜智能科技有限公司总裁马堃为我们带来了《AI应用在家庭中的演进与
2023-12-01 19:06:00
更多关于财经的资讯:
视频丨从“过客”到“创客”:海南自贸港如何让老外“不见外”?
良好的生态环境和开放的政策红利,已吸引不少中、外企业以海南自贸港为起点,拓展全球市场。海南正积极打造中国企业走向国际市场的总部基地
2025-12-19 16:02:00
经济大省挑大梁丨中国电商直通欧洲2亿人的“空中快线”
中国“出海四小龙”货通全球,每天超万吨包裹飞往全球。但你知道最快进入中东欧2亿人市场的“秘密通道”在哪吗?内陆腹地的郑州开出一条黄金航线
2025-12-19 16:02:00
· 【中央经济工作会议目标任务解读】发挥存量政策和增量政策集成效应
中央经济工作会议在部署明年经济工作时强调,要坚持稳中求进、提质增效,发挥存量政策和增量政策集成效应,加大逆周期和跨周期调节力度
2025-12-19 16:03:00
编者按:2025年是“十四五”收官之年,也是中国式现代化进程中具有重要意义的一年。回眸这一年,经济的脉动、社会的情绪、生活的变迁
2025-12-19 16:03:00
文图墨画诠合规 建言献策筑防线 赫章农商银行“我为合规献策”征集活动圆满落幕
为凝聚全员智慧,筑牢合规防线,由赫章农商银行主办的“我为合规献策”征集活动已圆满落幕。活动期间,来自全行各部门、各机构的员工踊跃报名参赛
2025-12-19 16:10:00
聚焦贵州文旅,助力乡村振兴“民宿贷”服务案例
贵州某文旅公司在贵州市场深耕数年,其定位高端精品民宿,以其独特的选址、稀缺的自然景观及独具匠心的装修设计风格,深受广大热爱旅游人群的认可
2025-12-19 16:10:00
“科技e贷”破题融资难,光大银行贵阳分行500万“活水”润泽科技型小微企业
光大银行贵阳分行积极贯彻落实党中央、国务院关于普惠金融的重大战略部署,严格执行相关政策要求,致力于做好科技金融、普惠金融
2025-12-19 16:11:00
赫章农商银行辅处支行:关爱零距离,反诈护晚年
为提高老年人的金融素养,增强老年人的防诈意识,近日,赫章农商银行辅处支行走进辅处乡养老院,开展“关爱零距离,反诈护晚年”的金融知识宣教活动
2025-12-19 16:11:00
康师傅饮品投资公司更换法人代表、董事长
近日,康师傅饮品投资(中国)有限公司发生工商变更,蔡慈源卸任法定代表人、董事长,由邱世煌接任。企查查信息显示,该公司成立于2011年5月
2025-12-19 16:12:00
各地多举措激发冰雪消费活力
央视新闻客户端消息(新闻联播):这个冬天,各地以“冰雪+”为核心的新模式、新场景不断涌现,激发冰雪消费,释放市场活力。辽宁推出五条特色旅游线路
2025-12-19 16:33:00
今年冬至饺子馅创新十足!饺子馆相关企业多分布在华北地区
冬至临近,“吃饺子”这一习俗在北方深入民心。冬至吃饺子源于东汉张仲景“祛寒娇耳汤”的典故,至今北方仍流传“冬至不端饺子碗
2025-12-19 16:36:00
皇氏集团成立臻选供应链公司
近日,广西皇氏臻选供应链有限公司成立,法定代表人为杨锦坤,经营范围包含:供应链管理服务;食用农产品零售;食用农产品批发;农副产品销售;水产品零售;水产品批发等。企查查股权穿透显示
2025-12-19 16:36:00
探索安心消费服务 美团“安心学”河南首城落地
大河网讯 兴趣班培训跑路维权难、运动培训大额课包不敢买……这些消费痛点总是隔三岔五出现在家长讨论群。一些商家利用大额充值模式快速回笼资金后跑路
2025-12-19 16:38:00
中国建设银行大连普兰店支行因贷款“三查”不到位被罚款五十万元
12月19日,国家金融监督管理总局大连监管局行政处罚信息公开表显示,中国建设银行股份有限公司大连普兰店支行因贷款“三查”不到位被罚款五十万元;关某涛、修某、王某被警告。
2025-12-19 16:55:00
中国人民财产保险大连市中山支公司因虚构保险中介业务被罚款二十五万元
12月19日,国家金融监督管理总局大连监管局行政处罚信息公开表显示,中国人民财产保险股份有限公司大连市中山支公司因虚构保险中介业务被罚款二十五万元;张某敏被警告并处七万元罚款。
2025-12-19 16:55:00