• 我的订阅
  • 科技

商汤科技发布日日新5.0大模型

类别:科技 发布时间:2024-04-29 04:36:00 来源:每日看点快看

本文转自:劳动报

商汤科技发布日日新5.0大模型

五大产品全新亮相 局部能力赶超GPT-4

本报讯(劳动报记者 陈宁)日前,在上海商汤临港AIDC举行的“2024年商汤技术交流日”活动现场,商汤发布行业首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求,并且全新升级“日日新SenseNova 5.0”大模型体系,其综合能力全面对标GPT-4 Turbo,技术领跑加速生成式AI向产业落地的全面跃迁,实现大模型按需所取。

五大模型全新亮相

局部能力赶超GPT-4

按照科技行业普遍观点,某个技术超越科技奇点后就会产生科技大爆炸,围绕该技术的各类应用层出不穷,继而激活一轮新科技革命。在2024商汤技术交流日上,面对眼花缭乱的AI应用,与会观众无不感叹:“AI正在进入‘大航海时代’。”

厚积薄发之下,2023年上半年,商汤科技顺应潮流,发布了“日日新SenseNova”大模型体系和生成式AI产品系列,其中包括商量、秒画、如影、琼宇、格物五大模型,分别对应着自然语言交互、AI文生图、数字人、3D大场景重建、3D小物体生成这五个主流的AIGC应用。

在技术交流日,记者发现,这五大模型以全新版本全面亮相,其中一些局部能力甚至赶超GPT-4。

大语言模型完成各种任务的基础,是能够理解用户提出的问题,并搞清楚文字背后的意图。许多中国的公司比较自研模型与GPT-4 等海外模型时,会强调自己的模型更懂中文。记者就在现场测试了商汤“商量”大语言模型的中文理解能力。

根据现场工作人员提示,记者“调取”了资料库里《道德经》《论语》《易经》这三本古籍的文档,并输入“找到文章的名字,一句话总结,并写出摘要”等指令,几秒钟内,“商量”便有条不紊地输出相关内容,包括每章节的名字、大纲概要,对内容的总结理解等。记者粗略浏览了一页,“商量”撰写的内容言简意赅,内容排版清晰,用户在阅读时能够准确及时找到每本书每章节对应的概要。

除了对中文的深入理解能力,“商量”的数学理解能力也是一大优势。据了解,数学曾一度是大语言模型的短板,GPT-3.5发布后,也被指出过做不了简单数学题。记者在现场“调取”了一页数学题,要求“商量”解答其中一道“判断题:求商的近似值时,要保留三位小数,就要除到商的百分位。”“商量”给出的答案为:(×)。

“商量”解释称,求商的近似值时,保留几位小数并不直接决定于除法运算进行到哪一位,而是根据题目要求决定保留的小数位数。如果要求保留三位小数,那么除法的结果至少要到千分位,并且根据第四位小数来决定是否进位。因此,该说法不准确。同时,它还附上了正确做法。

聚集增强

数学、推理及代码能力

商汤生成式AI产品系列的突破性表现,得益于其最新发布的日日新5.0版本大模型。记者了解到,自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、覆盖大量合成数据,全新的“日日新SenseNova 5.0”采用混合专家架构,推理时上下文窗口可以有效到200K左右。

技术交流日上,商汤科技董事长兼CEO徐立表示,本次更新主要聚集增强了知识、数学、推理及代码能力,全面对标GPT-4 Turbo,主流客观评测上达到或超越GPT-4 Turbo。

在文科能力方面,“日日新5.0”的创意写作能力、推理能力以及总结能力均大幅提升,相同的中文知识注入后,可以获得更好的理解总结及问答,为教育、内容产业等垂直应用场景提供有力辅助;在理科能力方面,“日日新5.0”数理能力、代码能力及推理能力达到业内领先水平,为金融、数据分析等场景落地提供坚实基础。

本次“日日新5.0”另一大核心指标就是多模态能力,与此同时,在应用产品层面也实现了更卓越的多模态能力,支持高清长图的解析和理解以及文生图交互式生成,还可以实现复杂的跨文档知识抽取及总结问答展示,还具备丰富的多模态交互能力。

在本次技术交流日最后环节,徐立还带来了三段完全由大模型生成的视频,并强调文生视频平台对于人物、动作和场景的可控性。他表示,通过商汤打造的智能算力中心,可以不断赋能于大模型的训练,目前,日日新大模型体系在自然语言处理、视频生成和深度学习优化等多个方面取得创新。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-04-29 05:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

商汤科技sensetime推出“云端边”全栈大模型体系
2024年4月23日,上海——商汤科技SenseTime举办技术交流日活动,发布行业首个“云、端、边”全栈大模型产品矩阵
2024-04-25 01:02:00
AI大模型加持,商汤科技的产品多元化与商业化加速
...用,也逐渐找到了用武之地。例如,作为AI四小龙之一的商汤科技,便是以AI视觉技术起家,通过研发人工智能软件与应用,打造了一个数百亿市值的商业帝国。2021年12月,商汤科技登
2023-12-12 09:38:00
商汤科技与金山办公达成商业合作,“日日新”大模型补强办公软件理科大脑
4月9日,在金山办公生产力大会上,金山办公展示了携手商汤科技等国内大模型厂商打造的办公平台WPS365。商汤“日日新”大模型凭借其卓越的代码生成及工具调用能力助力WPS365打造
2024-04-12 15:11:00
“大装置+大模型”战略:助力商汤迅速获取生成式AI商业化果实
...机会。从AI1.0向AI2.0演进,全球领先的人工智能软件公司商汤集团股份有限公司(下文简称“商汤”)成为立于潮头的那个
2024-04-01 15:16:00
商汤日日新大模型体系更迭升级,金融、医疗等行业场景落地已超20个|WAIC 2023
今年6月拍摄的商汤大模型产品商量SenseChat界面(来源:钛媒体App编辑拍摄)时隔仅3个月,商汤“日日新”AI大模型正式更新
2023-07-11 13:00:00
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
...昌均在ChatGPT引发的大模型和生成式AI热潮下,国内AI公司商汤科技也秀出自家肌肉。在4月10日下午的技术交流日上
2023-04-14 14:00:00
商汤科技发布“书生·浦语”大模型 中文考试超越ChatGPT
...各业,据CNMO了解,近日,行业领先的人工智能软件公司商汤科技与上海AI实验室等发布了“书生·浦语”大模型。商汤科技据媒体报道,商汤科技、上海AI实验室联合香港中文大学、复旦
2023-06-08 00:13:00
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣味推理问题。4月23日,在202
2024-04-24 09:32:00
AI难盈利,商汤生成式AI创收12亿增长两倍,全年净利亏损65亿
... 搜狐科技作者 | 梁昌均在传统AI业务式微下,大模型成了商汤的新亮点。这家公司最新发布的财报显示,去年实现总收入34亿元
2024-03-27 15:00:00
更多关于科技的资讯: