• 我的订阅
  • 科技

商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招

类别:科技 发布时间:2023-04-14 14:00:00 来源:搜狐科技
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招

出品 | 搜狐科技

作者 | 梁昌均

在ChatGPT引发的大模型和生成式AI热潮下,国内AI公司商汤科技也秀出自家肌肉。

在4月10日下午的技术交流日上,商汤正式发布“日日新SenseNova”大模型体系。这一大模型体系的名称取自《礼记·大学》中“汤之盘铭曰:苟日新、日日新、又日新“。

商汤科技董事长兼CEO徐立表示,这寓意商汤在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI(通用人工智能)的更多可能。“日日新很像是一个超市,寓意也不错,商汤将提供一个大模型的超市。”

他现场演示了这个超市中的语言大模型、AI文生图创作、2D/3D数字人生成、大场景/小物体生成等生成式AI模型及应用。整体表现收获不少好评,有网友称之为“AI实干家”。

这背后是商汤长期的技术积累,包括投资百亿的算力基础设施SenseCore AI大装置,五年累计超过128亿元的投入,以及在计算机视觉、自然语言理解等大模型领域的多点开花。

“AI大模型会带来新的生产范式,将为我们带来无限的可能性,这件事情无比让人兴奋。我们也会将AGI作为核心的发展目标,在未来几年持续推动大模型和AGI技术的突破。”徐立在发布会上表示。

大模型+大算力,走出自己的AGI发展之路

在活动现场,商汤重点演示了基于“日日新SenseNova”大模型体系自研的大型语言模型“商量SenseChat”。它具备多轮对话和超长文本的理解能力,以及逻辑推演能力,让它编写广告语、邀请函、小说故事都不在话下。

同时,“商量SenseChat”可以作为编程助手,帮助开发者更高效地编写和调试代码;可以是健康咨询助手,提供个性化的医疗建议;也可以是PDF文件阅读助手,从复杂文档中提取和概括信息。

商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招

此外,商汤还演示了AI文生图创作、2D/3D数字人生成、大场景/小物体生成等AIGC(人工智能内容生成)大模型及应用。

秒画“SenseMirage”不仅融合了超10亿参数的商汤自研文生图生成模型,支持二次元、三次元等多种生成风格,能表现出光影、细节等,并支持6K高清图的生成,还支持一键导入多个平台的开源模型或上传用户本地模型并对其进行特异性推理加速优化,结合自研模型及训练能力,用户可免除本地化部署流程,并基于开源模型自训练模型,高效地生成更多样的内容。

商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招

技术交流会现场,徐立不仅演示了基于商汤自研AIGC模型的作图(MH team作品),也介绍了用户可导入开源模型并通过秒画平台对该模型加速推理(作画)的能力”。

AI数字人视频生成平台“如影SenseAvatar”仅需一段5分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。3D内容生成平台“琼宇SenseSpace”和“格物SenseThings”则可以高效低成本生成大规模三维场景和精细化的物件,适用于元宇宙、虚实融合应用等场景。

这些大模型的背后都离不开大规模AI基础设施的算力支持,“日日新SenseNova”大模型体系正是基于商汤AI大装置SenseCore打造。

徐立表示,在AI大模型时代,数据、算法和算力这三要素在经历新的演变,对模型能力也有新的注解。“今天衡量一个模型能力的时候,不能够简单来看模型的参数量,而是要用计算量来做标定。”计算量即为参数量和数据量的乘积,拆解来看就是GPU数量乘以大规模并行计算的效率再乘以运行的时间。

商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招

徐立表示,过去10年最好的AI算法对算力的需求增长超过100万倍,也就是每两年最先进的算力要提高一个数量级才能支持好最好的AI大模型,而未来对计算量需求将呈现爆发式增长。

这一方面是大模型参数量将以指数级的速率提升,另一方面是数据量随着多模态的引入也将大规模增长。不过,徐立提到,虽然目前业界训练模型对基础算力、基础设施的需求非常旺盛,但基础算力里对并行效率的要求非常高,真正好用的基础设施非常稀缺。

为此商汤从2016年开始,累计投入百亿打造了算力、平台和算法一体化的人工智能底层基础设施SenseCore AI大装置,并在上海临港兴建了亚洲最大的人工智能计算中心(AIDC),是亚洲目前最大的智能计算平台之一。

自AIDC在去年启用后,SenseCore持续扩建,在27000块GPU芯片卡的加持下,可以输出5.0 exaFLOPS(每秒5百亿亿次)的总算力,可最多支持20个千亿参数量大模型(以千卡并行)同时训练,最高可支持万亿参数超大模型的训练。

同时,基于AI大装置的能力,商汤大模型也加速成长,已构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型。

商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招

在这个过程中,商汤形成以“大模型+大算力”的方式推进AGI的发展路径。商汤认为,在“日日新SenseNova”大模型体系和SenseCore AI大装置的支持下,持续演进的多模态大模型,加上决策智能大模型,将成为AGI实现的重要起点。

坚持长期投入,从数据飞轮向智慧飞轮演进

面对AIGC和大模型的浪潮,商汤能够抢先抓住机遇,很大程度来讲,是其坚持长期研发投入和技术积累的必然。

商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招

虽然人类的80%的信息是通过眼睛来获取,但商汤并不仅仅着眼于计算机视觉领域,而是寻求技术多点开花。除了计算机视觉大模型,商汤还在自然语言处理、多模态、AIGC、决策智能等AI大模型上取得突破,包括此次发布的1800亿参数的NLP大模型,以及早前宣布开源的30亿参数的多模态大模型书生2.5等。

“所有这些积累,不同的模态,它的汇聚,促使我们正在去训练一个更加强大的多模态大模型。”商汤科技联合创始人、首席科学家王晓刚表示。

而为了满足这些大型复杂AI模型的训练需求,商汤也续优化分布式计算平台、节能数据中心、高速网络架构、高性能存储系统、训练容错与可靠性、数据安全平台、混合云计算及性能监控分析等系统和能力。

“AGI催生了新的研究范式,即基于一个强大的多模态基模型,通过强化学习和人类反馈不断解锁基模型新的能力,从而更高效地解决海量的开放式任务。”王晓刚表示。

同时,他认为,AGI将实现从数据飞轮到智慧飞轮的演进,最终迈向人机共智。通过长期的研发投入和技术积累,商汤正在这条演进之路上大步向前。

加速大模型落地,重塑生产力和交互工具

对于此次推出的“日日新SenseNova”大模型体系,商汤也宣布提供API接口和服务,包括图片生成、自然语言生成、视觉感知通用任务与数据标注服务。

商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招

基于AI大装置SenseCore和“日日新SenseNova”大模型体系,商汤还面向行业伙伴提供涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署等多种大模型即服务(MaaS),并带来效率的快速提升,如基于预训练大模型的自动化数据标注相较于人工速度提升近百倍,模型推理部署服务可将大模型推理效率提高100%以上。

去年商汤就已对外开放了SenseCore的服务能力,已支持8家客户进行大模型训练,总共提供了7000多张GPU卡。目前,SenseCore已支持超过10个大模型训练项目,包括语言大模型、文生图模型、视觉大模型、多模态模型等自研模型和客户自定义模型。

“日日新SenseNova”等大模型也为商汤的自身业务实现突破。据王晓刚介绍,商汤的超大模型已覆盖了公司核心业务,在智慧城市、智慧商业、智能汽车和智慧生活四大板块20多个场景实现落地。

在智能驾驶领域,基于视觉大模型,商汤实现了可识别3000类物体的BEV环视通用感知算法的实车量产,构建了感知决策一体化的自动驾驶多模态模型。

目前,智能汽车是商汤增长最快的业务代表之一,去年营收近3亿元,同比增长近60%,相关产品量产交付数量超50万,新增定点数超800万辆。王晓刚称,未来将利用多模态大模型,进一步去推动自动驾驶技术的发展。

在智慧生活的场景落地方面,商汤升级了SenseMARS混合现实平台,以AIGC多模态能力赋能小红书、微博、B站等超过200个APP应用。

商汤还透露,去年SenseCore对外服务产生的收入在智慧商业板块总的占比超过20%,并预计该业务在今年的收入规模将大幅增加。随着“日日新SenseNova”大模型体系开放API和MaaS服务,该板块有望迎来更快增长。

1956年,人工智能这个词和粒子对撞机同时发明出来,粒子对撞机作为物理学最大的基础设施大装置,给行业推进带来了动力。徐立希望,商汤的AI大装置不仅可以支持自身的大模型训练,也能支持下游生态,从而使得AI在大模型时代更好地赋能百业。

“我们将通用人工智能作为核心发展战略,以期在未来几年内实现重大突破。商汤将一如既往地坚定投入在迈向通用人工智能的前沿研发与商业化进程中。”徐立表示。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-04-17 00:45:56

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

“大装置+大模型”战略:助力商汤迅速获取生成式AI商业化果实
...机会。从AI1.0向AI2.0演进,全球领先的人工智能软件公司商汤集团股份有限公司(下文简称“商汤”)成为立于潮头的那个
2024-04-01 15:16:00
商汤日日新大模型体系更迭升级,金融、医疗等行业场景落地已超20个|WAIC 2023
今年6月拍摄的商汤大模型产品商量SenseChat界面(来源:钛媒体App编辑拍摄)时隔仅3个月,商汤“日日新”AI大模型正式更新
2023-07-11 13:00:00
商汤大模型落地智能汽车,“车舱大脑”可拟人化交互
商汤大模型落地智能汽车,“车舱大脑”可拟人化交互 “智能汽车是AGI(通用人工智能)实现闭环的理想场景,希望车和AI模型之间产生更多有效互动,完成从人到车到AI模型的互动闭环,让
2023-08-27 15:01:00
商汤集团上半年生成式AI收入同比增逾670%
...币-人民币双柜台模式”的上市公司、人工智能软件公司商汤集团股份有限公司(商汤集团)28日在香港公布2023年上半年中期业绩
2023-08-28 23:02:00
AI大模型加持,商汤科技的产品多元化与商业化加速
...用,也逐渐找到了用武之地。例如,作为AI四小龙之一的商汤科技,便是以AI视觉技术起家,通过研发人工智能软件与应用,打造了一个数百亿市值的商业帝国。2021年12月,商汤科技登
2023-12-12 09:38:00
商汤大装置:打造人工智能算力“样板间”,从AI 1.0跨越到2.0时代
在上海临港新片区,中国AIDC建设的“样板间”——商汤科技上海新一代人工智能计算与赋能平台(商汤临港AIDC)正以惊人的速度,不断挑战自我。目前,算力规模已高达8100 peta
2024-04-01 09:24:00
商汤联合发布白皮书,首次提出新一代AI基础设施评估体系
近日,商汤科技智能产业研究院与中国信息通信研究院云计算与大数据研究所,中国智能算力产业联盟,人工智能算力产业生态联盟,联合发布《新一代人工智能基础设施白皮书》(以下简称《白皮书》
2024-01-02 21:30:00
商汤绝影首秀欧洲,携智能座舱大模型全系产品闪耀慕尼黑车展
...盛大开幕。“智能汽车时代的通用人工智能核心供应商”商汤绝影上演欧洲首秀,开启国际化新征程。基于以座舱大脑为核心的全新智能座舱架构,商汤绝影在本次博览会上首次全方位展示了智能座
2023-09-05 16:51:00
商汤2023年上半年营收微增,成本激增毛利骤降,生成式AI收入增670%
亏损净额同比仅收窄2%,开始裁员,商汤科技能看到盈利的曙光吗?8月28日,商汤集团股份有限公司公布其2023年上半年业绩报告
2023-08-29 15:26:00
更多关于科技的资讯: