• 我的订阅
  • 科技

超星未来梁爽:软硬件协同优化,赋能AI 2.0新时代

类别:科技 发布时间:2024-07-22 13:00:00 来源:爱云资讯

近日,第三届清华大学汽车芯片设计及产业应用研讨会暨校友论坛在芜湖成功举行。作为本次活动的特邀嘉宾,超星未来联合创始人、CEO梁爽博士出席并发表主题演讲《软硬件协同优化,赋能AI2.0新时代》。

超星未来梁爽:软硬件协同优化,赋能AI 2.0新时代

大模型是AI2.0时代的“蒸汽机”

AI+X应用落地及边缘计算将成为关键

自ChatGPT发布以来,大模型引爆“第四次工业革命”,成为AI2.0时代的“蒸汽机”,驱动着千行百业智能化变革。保尔·芒图曾说:“蒸汽机并不创造大工业,但是它却为大工业提供了动力”,大模型也是如此,本身不会直接创造新的产业,而是与已有的行业应用场景及数据结合创造价值。

WAIC2024落幕后,有媒体评论:大模型再无新玩家,AGI下半场是计算与应用。梁爽认为,AGI下半场将是AI+X应用落地和边缘计算。AI1.0时代,服务器侧的神经网络模型,在安防、智能驾驶等应用领域里逐步下沉到边缘端,这一趋势也一定会在AI2.0的时代再演绎一次,并且将在智慧城市、汽车、机器人、消费电子等领域创造出更为广阔的增量市场。

超星未来梁爽:软硬件协同优化,赋能AI 2.0新时代

回顾AI的演进历史,可以看到,AI1.0时代的主要模式是通过单一模型完成单一任务,例如安防、人脸识别、语音识别,以及基于感知-决策-控制分模块的智能辅助驾驶方案。梁爽认为,现在正进入一个“AI1.5时代”,在智能驾驶、机器人等复杂系统中,统一用神经网络完成各个模块功能的实现,尽量减少人工规则,并通过数据驱动的范式提升性能,大幅降低人工处理各种长尾问题的难度。在AI2.0时代,系统将由一个统一的通用基础大模型来应对多源数据输入,完成多种复杂任务,这一基础模型应该具备感知万物、知晓常识和理解推理的能力,智能驾驶、机器人的基础模型本质上是同一类基础模型。

端到端与大模型上车进行时

智能汽车是迈向通用机器人的必要阶段

近年来,智驾系统正在从传统的单传感器CNN感知,逐步升级到多传感器CNNBEV,基于Transformer的BEV和Occupancy方案,并正在向端到端大模型演进。随着规控部分逐步模型化,中间没有规则介入,因而在海量高质量数据驱动下,性能天花板会大幅提升,并大幅降低了应对长尾问题的人工参与度,使得软件工程量最多可下降99%。此外,视觉大模型的上车,帮助智驾系统进一步增加了对物理世界复杂语义的理解,使驾驶的行为更接近于人,提升了对未知场景的泛化处理能力。

超星未来梁爽:软硬件协同优化,赋能AI 2.0新时代

梁爽指出,智能汽车将是未来迈向通用机器人的一个必要阶段,例如TESLA的Optimus机器人和智能汽车采用了同样的FSD平台,并且在系统配置、功能任务上相同。虽然两者的系统组成和迭代升级高度相似,但机器人的维度更高、任务更复杂,大模型下沉部署到边缘侧的设备里,形成一个“Robot-Brain”,会成为行业发展的关键。

大模型落地边缘侧存在较大挑战

软硬件协同优化是现实可行的落地路径

过去十年被称为AI加速器的黄金十年,CNN加速器的能效已经提升到了100TOPS/W级别。大模型的规模以及参数增长速度远超CNN时代,大幅超出了传统计算硬件的增长速度。而当前大模型的处理器能效仍小于1TOPS/W,与边缘侧应用需求存在两个数量级的差距,严重限制了大模型的落地。

超星未来梁爽:软硬件协同优化,赋能AI 2.0新时代

(摘选自汪玉教授发表于2024年1月的报告《端侧大模型推理,智能芯片的现状与展望》)

目前很多手机端本地部署的2B以内的“小”模型,在应用到边缘侧场景时,通常会出现历史信息遗忘等能力限制,而需求量更大、效果显著提升的7B量级以上的大模型,通常难以部署到现有的边缘侧芯片上,主要原因包括:(1)传统架构矩阵算力缺口明显,大模型中50-80%算力需求在Attention层中的各类矩阵计算,并且KV矩阵有明显稀疏性,需要专项支持;(2)大模型的参数量和带宽需求巨大,单7B级别的浮点模型就需要28GByte的存储空间,且权重的局域性比较低,所以大模型计算处理的过程需要频繁地对外存进行读取,每个Token的带宽需求都会大于10GB/s;(3)当前架构精度类型不足,计算精度传统的CNN网络通常可以用INT8实现较好的处理效果,而大模型中的各类算子会需要诸如INT4/FP8/BF16等不同精度的计算支持,并且像激活层、Norm层等的数据动态范围大,导致很多已有的量化算法也不能很好地支持。

超星未来梁爽:软硬件协同优化,赋能AI 2.0新时代

从提升大模型在边缘侧处理能效的方法来看,一种是通过提升工艺水平scalingdown,但受摩尔定律和国际形势的影响,很难再继续持续;另一种是通过新器件和新系统,但应用的成熟度还有待技术上的进一步提升与完善。但在当下来看最为现实的实现手段,就是针对大模型应用来做软硬件协同优化,软件上通过新的混合量化方法以及稀疏化处理,硬件上则针对大模型中常见的算法结构进行加速设计,从而整体上实现2-3个数量级的能效提升。

针对大模型任务新需求深度优化

超星未来实现边缘侧AGI计算行业领先

超星未来主要面向各类边缘智能场景,提供以AI计算芯片为核心、软硬件协同的高能效计算方案,致力于成为边缘侧AGI计算的引领者。

「平湖/高峡」NPU团队十年磨一剑,实现性能行业天花板

针对智能驾驶及大模型所需要的神经网络计算任务,超星未来自研了高性能AI处理核心「平湖」和「高峡」。「平湖」NPU主要针对以CNN和少量Transformer的感知类任务提供高效的计算,「高峡」NPU则是面向高阶智驾以及大模型的实时处理专门设计的加速核心。

其中「平湖」NPU针对主流CNN/Transformer模型的推理延迟以及帧率均为行业最领先水平,与某款市场上被广泛认可的竞品相比,单位算力的推理帧率在CNN任务上提高10倍,Transformer任务提高25倍。

「高峡」NPU架构采用了混合粒度的指令集设计,单Cluster可实现40TOPS算力,支持INT4/INT8/FP8/BF16多种不同计算精度,并且在内部缓存设计上做了优化设计,另外针对SparseAttention和三维稀疏卷积,设计了专用的加速结构。通过这些优化设计,「高峡」NPU实现了对典型的生成式大模型的实时计算支持,LLaMA3-8B生成速度最高可达60tokens/s。此外,「高峡」NPU可以用相较NVIDIAOrin芯片1%的计算逻辑面积,来实现近乎等同的三维稀疏卷积处理速率。

「惊蛰」系列芯片已于多领域批量落地,最新产品实现大模型边缘侧实时计算

基于自研的NPU核心,超星未来在2022年底发布了边缘侧AI计算芯片「惊蛰R1」,NPU算力为16TOPS@INT8,典型功耗仅7-8W,从而可以支撑起各类系统方案的自然散热设计。「惊蛰R1」目前已在汽车、电力、煤矿以及机器人等领域实现了批量落地。

超星未来梁爽:软硬件协同优化,赋能AI 2.0新时代

超星未来也即将发布「惊蛰」系列下一代芯片,可实现对大模型的实时处理,在12nm制程下将等同于骁龙8Gen3、天玑9300等SOTA手机芯片的处理效果。按照超星未来的芯片产品发展路径图,公司将继续保持产品矩阵的可扩展性,从边缘感知到智驾升级,逐步迈向“Robot-Brain”。

「鲁班」模型部署工具链集成大模型优化新方法,软件协同实现40倍性能提升

在高效硬件架构的基础上,超星未来面向神经网络应用打造深度优化的「鲁班」工具链,可使边缘侧推理速度提高40倍以上,具体包括:

(1)业内领先的混合精度量化工具,支持PTQ/QAT/AWQ功能,支持INT4/INT8/FP8/BF16精度,量化损失小于1%;

(2)高效模型优化工具,支持敏感度分析、蒸馏、Lora,在精度损失小于1%的情况下,模型压缩率超10倍;

(3)高性能编译工具,提供丰富的计算图优化技术及面向异构核心的高效指令调度,推理效率可提高4-5倍以上。

特别针对大模型任务,「鲁班」通过特有的稀疏离群点保持和混合位宽量化的方法,可将权重位宽下探到平均2.8bit。基于稀疏掩膜的方法,可实现在模型处理能力相当的情况下,将LLaMA3-8B压缩90%以上,大幅缩减了模型的参数和计算量。

「仓颉」数据闭环平台实现数据自动化生产,构建应用迭代闭环

在大模型时代,高质量算法迭代需要功能强大的数据闭环工具。因此超星未来打造了「仓颉」平台,包括数据管理、数据挖掘、数据增强、真值生产、模型生产和算法评测等功能,并且在多个环节都应用了大模型来提供功能上的增强。

基于该平台,通过构建完整流程,客户可以从环境中获取有效数据,并尽可能降低人工的参与程度,实现自动的数据挖掘和标注,从而助力客户实现数据驱动算法的迭代。目前「仓颉」平台已为车企、Tier1等客户提供了服务,同时也在延伸为机器人客户提供支持的能力。

脚踏实地,快步向前

为客户提供高效的“AI+”

基于团队在AI领域十余年的研发与实践经历,超星未来紧跟AI1.0到AI2.0的发展路径,不断打磨核心产品,实现AI+X应用落地。

在边缘侧场景,超星未来已在电力、煤矿等泛安防领域实现了芯片产品的批量落地,实现了规模化的营收回报,并通过落地,持续迭代产品相关生态,形成对智能驾驶与AGI等长周期方向的反哺。“在当前恶劣的市场环境下,实现快速的落地才是生存的王道。”

超星未来梁爽:软硬件协同优化,赋能AI 2.0新时代

在智能驾驶场景,「惊蛰」系列芯片可支持多维智驾解决方案,如智能前视一体机、双目前视方案、5-7V高性价比行泊一体、11V1L高性能行泊一体等,并涵盖主流的行车、泊车以及智能驾驶和机器人通用的双目功能。相关产品的参考解决方案已基于实车完成了打通和工程优化。目前,超星未来已与某行业头部商用车OEM合作上车,同时与多家乘用车OEM客户达成业务合作,预计最早于2025年实现批量上车。

在边缘侧大模型推理场景,基于「鲁班」工具链的软硬件协同优化能力,超星未来最新芯片产品在验证平台上实测ChatGLM-6B可以达到超过15tokens/s的生成速度,10W量级的芯片即可支持高性能大模型的边缘落地;「高峡」NPU平台StableDiffusion1.5版本可以在3.5s内完成图片生成。基于以上能力,超星未来已与行业头部的机器人客户、大模型厂商等达成合作。

道阻且长,行则将至

共同构建AI2.0新时代

“我们对技术发展的预估和意识通常是低估和滞后的,技术的发展一旦突破某个阈值,就会爆炸式地增长、覆盖,比如从ChatGPT的发布到现如今的‘千模大战’。不论是高阶的智能驾驶,还是通用机器人应用,只要技术范式是正确的,人员与资金持续投入,‘ChatGPT时刻’就一定会到来,而且这个时刻或许会比我们想象得来得更快。”梁爽表示,“超星未来期待与各位合作伙伴携手,从AI1.0时代逐步迈进,共建AI2.0的新时代。”

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-22 17:45:11

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

超星未来与埃夫特达成战略合作,携手打造具身智能「通用大脑」
8月21日,「北京超星未来科技有限公司」(以下简称“超星未来”)与「埃夫特智能装备股份有限公司」(以下简称“埃夫特”)达成战略合作。双方将围绕具身智能的实际场景与应用需求,在基础
2024-08-23 10:45:00
超星未来与恒达智控达成战略合作,携手拓展AI芯片行业市场
8月4日,「超星未来」宣布与郑煤机旗下子公司煤炭智能化开采控制系统提供商「恒达智控」达成战略合作,双方将在矿山领域围绕井下集控中心AI分析设备、井上AI分析服务器、边缘管理平台软
2023-08-12 21:00:00
寿山福海“新中式养老”新范式,多方联动打造多元养老业态
...家庭观、孝道观、医养观”为文化根脉,立足当下,激活新时代“新中式养老”的全新内核。会后,寿山福海养老集团总裁刘玥接受北青报专访时谈及,当下中国老人因过往时代塑造的认知特点与文
2025-09-15 10:25:00
阴阳师超星什么意思
在阴阳师游戏中,超星的意思就是:玩家所配置的某个式神的速度要超过晴明、神乐、博源雅、八百比丘尼这四位阴阳师的速度,这就叫超星,而超星也是阴阳师游戏中的一个玩家之间的游戏术语。玩家
2023-01-21 00:17:00
人工智能时代高校图书馆转型与发展研讨会在济南举行
...校图书馆必须把握人工智能带来的历史性机遇,构建适应新时代需求的服务体系,深化资源整合与智慧服务能力,强化文化传承与价值引领功能,夯实人工智能发展的要素支撑,助力高等教育迈向新
2025-05-22 21:30:00
联合出海!300余位专家共聚武汉商学院 探讨通识教育发展
...识教育的管理与实践探索、人工智能赋能通识课程变革、新时代高校劳动教育体系构建等问题开展探讨交流。开幕式上,武汉商学院党委书记孟武康先生致辞表示,人工智能有效融入通识教育,促进
2024-10-25 18:17:00
助推农业教育数字化转型!青岛农业大学发布新农科教育教学大模型
...会。本次发布的新农科教育教学大模型由青岛农业大学与超星集团合作,以超星汇雅大模型为技术基座,融合农业教育特点,通过超星与学校海量农科知识数据对接,辅以高质量指令精调,不断优化
2024-12-02 15:06:00
书香向北 阅见未来丨超星集团将携AI阅读与智慧文旅等成果亮相书博会
...。作为国内领先的数字阅读与智慧文旅解决方案提供商的超星集团也将参加此次书博会,他们将以“智慧赋能文旅·AI陪伴阅读”为核心主题,携多项创新成果重磅亮相,推出三大沉浸式体验展区
2025-04-22 15:49:00
阿迪达斯“SUPERNOVA超星动”家族迎来全新配色
...2024年3月强势发布专为慢跑打造的经典跑鞋系列“SUPERNOVA超星动”之后,今年8月SUPERNOVARISE全新配色再度来袭
2024-09-05 00:00:00
更多关于科技的资讯:
匠心护航丨济宁移动圆满完成2025嘉祥圣德山野音乐节通信保障
鲁网10月20日讯10月18-19日,“共赴山野之约,让旋律在自然间共鸣”群星演唱会在嘉祥九顶山激情开唱,华语乐坛知名歌手轮番登台
2025-10-20 12:17:00
移动的 “智算样板间” 亮相青岛,施耐德电气破解算力基建难题
10月17日,一场穿行14城、总里程近2万公里的技术巡展抵达青岛。施耐德电气关键电源巡卡车化身 “数据中心行业的技术样板间”
2025-10-20 12:45:00
彰显多维综合实力,Hape重装亮相2025中国玩具展
10月15至17日,由中国玩具和婴童用品协会(简称中国玩协)主办的第二十三届CTE中国玩具展&潮玩展、第十八届CLE中国授权展
2025-10-20 13:19:00
富士胶片91年传承,始终深耕影像领域,在不同时代适时推出符合当下需求的产品.。影像的发展从未离开过"光",近日FUJIKINA 2025富士胶片影像周以"光的交响曲"为题拉开序幕
2025-10-20 13:19:00
安踏儿童足弓PRO跑鞋获国际设计金奖 以科技守护青少年足弓健康
安踏儿童旗下产品“足弓PRO跑鞋”凭借对儿童足弓健康成长的深刻洞察与科学的产品设计,荣获2025年缪斯设计奖(MUSE Design Awards)金奖
2025-10-20 13:49:00
厦门网讯(厦门日报记者 李晓平)日前,厦门市工业和信息化局组织开展人工智能政策资金申报工作,“真金白银”推进今年我市出台的《厦门市进一步推动人工智能产业发展若干措施》(以下简称《若干措施》)落地见效
2025-10-20 08:56:00
报告:研学旅游市场分化趋势明显 监管滞后发展
10月18日,“2025首届旅行服务大会暨交易展——‘跨界协作•链动未来’研学新生态思享会”在海南三亚保利国际会展中心举行
2025-10-20 09:30:00
西乡街道企业人才训练营走进北科瑞声探寻AI声纹新未来
10月16日,由西乡街道党群服务中心主办的“AI赋能·智汇西乡”企业人才训练营系列活动之北科瑞声参访学习在新一代产业园顺利举行
2025-10-20 09:48:00
姬源在数字化浪潮席卷全球的今天,一个特殊的群体正在悄然形成,他们就是阿尔法一代(GenerationAlpha)。这一代人正值智能手机
2025-10-20 10:49:00
2025微博V影响力大会揭晓9组大V荣誉,“尽兴分享”推动社会价值沉淀
10月18日,2025微博V影响力大会在北京・微博IN跨次元引力场隆重举行。作为微博主办的年度重磅平台级活动,此次大会以“尽兴分享
2025-10-20 10:49:00
新闻纵深·聚焦2025中国国际数字经济博览会|人工智能赋能产业升级“下半场”
阅读提示数字浪潮,奔涌而至。10月17日至19日,2025中国国际数字经济博览会在石家庄举办。这场综合性数字经济大会,不仅搭建起国际数字经济交流合作的高端平台
2025-10-20 07:35:00
聚焦2025中国国际数字经济博览会|数字“加料”,生活可以这么“潮”
10月17日,观众和下棋机器人对弈。河北日报记者 史晟全摄数字让生活更美好。2025中国国际数字经济博览会上,众多数智技术闪亮登场
2025-10-20 07:37:00
河北日报讯(记者宋平)10月19日,2025京津冀AI赋能教育新生态大会在石家庄举办。来自政府、高校、科研机构与企业的与会嘉宾
2025-10-20 07:42:00
青春华章丨制造业“数智化”,“脑力”岗位需求旺
南航双选会上来了237家制造业单位制造业“数智化”,“脑力”岗位需求旺□南京日报/紫金山新闻记者姜静实习生黄佳琪杨久久400多家用人单位中
2025-10-20 07:43:00