• 我的订阅
  • 科技

NPU全球出货超1亿颗!芯原如何迎战大模型时代的边缘计算变革?

类别:科技 发布时间:2024-06-14 09:18:00 来源:芯东西

NPU全球出货超1亿颗!芯原如何迎战大模型时代的边缘计算变革?

芯东西6月13日报道,今日,在2024上海国际嵌入式展期间,芯原AI专题技术研讨会举办。

芯原执行副总裁、IP事业部总经理戴伟进在会上透露,芯原神经网络处理器(NPU)已在全球累计出货超过1亿颗,覆盖AI视觉、AI语音、AI图像,以及AIoT/智慧家居、AR/VR、自动驾驶、PC、智能手机、机器人等多种场景。

NPU全球出货超1亿颗!芯原如何迎战大模型时代的边缘计算变革?

▲芯原执行副总裁、IP事业部总经理戴伟进

与此同时,芯原图形处理器(GPU)已在全球累计出货近20亿颗;芯原视频处理器(VPU)也已经赋能智能视频处理等行业。

NPU全球出货超1亿颗!芯原如何迎战大模型时代的边缘计算变革?

戴伟进谈及了大模型推进边缘计算变革的机遇与挑战,他谈道,随着大模型的爆发,我们看到在手机、AI PC、汽车等各种终端,大模型正被加速引入嵌入式系统。

今天,大模型已经运行在AI PC、医疗系统设备等众多终端。面向这些场景,芯原AI-Computing处理器技术具有可编程、可扩展、高性能、低功耗的特征。

具体来看,芯原AI-Computing IP产品体系全面覆盖数据中心、边缘服务器及端侧设备。其中,NPU IP VIP9X00是面向推断、增量训练,GPGPU IP CC8X00是通用计算,NPU+GPU IP GC9X00AI是AI-GPU/AI-PC,Tensor Core GPU IP CCTC-MP则面向大语言模型推理、训练。

NPU全球出货超1亿颗!芯原如何迎战大模型时代的边缘计算变革?

芯原NPU IP研发副总裁查凯南谈道,NPU的发展近年来大概有三个方向:首先是DEEP AI,在很多嵌入式设备里面,要把AI跟其它的处理IP做比较紧耦合的绑定,可以方便做AI-ISP和AI Video;另外就是嵌入式设备和服务器中心。

NPU全球出货超1亿颗!芯原如何迎战大模型时代的边缘计算变革?

▲芯原NPU IP研发副总裁查凯南

端侧和云端对于NPU的要求分别是什么?

查凯南解读道,端侧更关注的是低功耗,一定要有比较好的PPA(功耗、性能和面积)。AI性能很重要,但是功耗、面积对于端侧的IP更重要。端侧主要是要做推理,也要有一些浮点运算的能力,更关注的是低比特的量化及压缩能力。

在云端,(更重要的)一定是高性能、非常高的TOPS,它要能够去做推理跟训练,而且不光是单卡的训练推理,还要做分布式的推理训练,需要多卡多机的能力。所以,云端需要的更多是通用的GPGPU的编程模型,需要比较高的浮点跟定点算力的配比,高精度是比较重要的,然后还要能够去接入到大的生态系统中去。

下图呈现了芯原NPU大概的架构,芯原NPU可以带浮点32去做大量通用运算,整个软件生态往上支持OpenCL等。

NPU全球出货超1亿颗!芯原如何迎战大模型时代的边缘计算变革?

在过去两年,Transformer已经变成一个主导的模型架构。芯原的NPU架构也专门对Transformer做了定制优化,包括4bit、8bit、16×4、16×8等。芯原把权重做4bit和8bit的量化压缩,从而大大减小带宽的消耗。对于通用的矩阵运算,GEMM/GEMV,Transformer需要的大量卷积运算,以及在Transformer里有不同的Vector(向量)直接构建到里面的带宽。

据称,芯原针对Transformer相关的网络性能提升达10倍。也就是说,在一个AI PC的40-48TOPS的算力下,芯原可以做到20Tokens/s,这个性能是相当不错的。

在软件方面,不管是端侧还是云侧,芯原都采用通用的软件栈。

应用层框架支持PyTorch、Transformer,专门针对大模型支持VLLM框架。再往下走,有通用的算子加速库及运算图加速库、多核间通讯库,底层支持有标准的OpenCL、OpenVX等。

NPU全球出货超1亿颗!芯原如何迎战大模型时代的边缘计算变革?

整个芯原的推理工具链,是芯原自研的,可以通过工具链直接导入所有类型框架;内部自嵌一些量化的功能,可以去直接生成一个非常易于部署的Generate Binary(生成二进制)。工具链可以支持微软的ONNX Runtime,今年10月还会接入OpenAI的Triton。

基于丰富的流片跟量产经验,芯原还推出了一站式定制芯片服务平台。

芯原高级副总裁、定制芯片平台事业部总经理汪志伟谈道,芯原有丰富的IP储备,有六大类处理器IP:神经网络NPU、图形GPU、视频VPU、音频/语音DSP、图象信号ISP、显示处理IP,所有的这些处理器的IP都被用到了设计AIGC相关的芯片中去。除此之外,芯原还有1500多颗数模混合IP和射频IP。

NPU全球出货超1亿颗!芯原如何迎战大模型时代的边缘计算变革?

▲芯原高级副总裁、定制芯片平台事业部总经理汪志伟

“我们每年都要帮客户设计30颗以上的芯片,全球首批7nm EUV芯片在2018年就一次流片成功,已经有多颗5nm芯片成功量产跟流片。我们在各种先进工艺节点有着丰富的流片与量产经验,从28nm-5nm,有大量的流片与量产的经验。”汪志伟说。据悉,芯原SiPaaS(芯片设计平台即服务)系统级芯片设计平台已经迭代多年,一次流片成功率能够达到90%以上。

大模型推进边缘计算变革

随着AI技术的快速发展与应用,大模型的部署已从云端训练,逐渐向边缘端推理和微调延伸,这一转变预示着边缘计算领域将迎来前所未有的机遇与挑战。

为了让大模型平滑顺利地进入嵌入式系统,芯原已经做了深入研究和布局。一方面,芯原的系列IP在手机、汽车等领域已经帮助客户部署了一些模型的应用,同时其AI-Computing软硬件技术也取得了新的进展,有望在AGI浪潮中引领新的计算变革。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-14 11:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

高通孟樸:终端侧生成式AI无处不在 将变革广泛终端
...樸指出,生成式AI的发展进一步完善了人机交互的方式,变革了智能终端的使用体验。云端AI和边缘AI的发展各有不同,终端侧AI带来即时性、可靠性、个性化、成本效益等诸多显著优势,
2023-11-06 14:38:00
王者出王炸!五家巨头联手抗衡!华为通信新模型加速赶来
...将带来比5G更快的下行速率,为通信行业带来一场革命性变革。华为的通信大模型技术成果备受瞩目,实现了通信和人工智能的强力结合,为未来通信发展描绘了一幅光明蓝图。本文将从华为通信
2024-02-27 14:48:00
把握AIGC全球变革趋势,微美全息(WIMI.US)推进云计算及AI产业高地建设
...在经历一波创业躁动,他们确信这一次大模型带来的技术变革比以往经历过的任何一次都要激烈。AI云计算“狂飙”在人工智能浪潮席卷之下,大语言模型的相继入世,而火热的大模型创投背后,
2023-08-26 01:00:00
...着科技创新在日常生活、科技前沿、产业转型升级、行业变革趋势等领域的应用,可谓是相当有“数”,含“数”量极高。数实融合,夯实产业协作的信任基础数实融合,是推动经济高质量发展的重
2023-09-11 06:06:00
AI芯片“顶流”齐聚深圳南山,逐鹿芯世界!
...用定义软件,软件定义芯片,是计算芯片技术的一次根本变革。”清华大学教授、中国半导体行业协会副理事长、IEEE Fellow魏少军表示,中国在软件定义芯片领域突破早于并优于世界
2023-09-17 07:46:00
大模型时代,谁才是第一终端?英特尔掀开AI PC万亿美金市场大幕
...。站在用户的角度,希望既要又要,大模型带来的生产力变革与理解自己的超级助手兼得,又不失数据和隐私安全。在多方面要求下,从算力、安全到交互与场景,AI PC是多个行业分析师给我
2023-12-15 11:02:00
联想创新之旅:探索科技与艺术的融合,迈向零碳智造未来
...(智能物联网、智能基础架构、行业智能与服务)智能化变革战略和新IT架构。在行业智能化方面,联想展示了在车机、智慧园区、医疗、教育、公共事业、交通、能源、电力等多领域的行业智能
2024-03-22 02:00:00
阿里云佘俊泉:创新涌现,边缘云场景的探索与机遇|GDCC智算
...,以助业内合作伙伴们更好地适应新一轮科技革命和产业变革趋势。3月27日,全球分布式云大会(GlobalDistributedCloudConference
2024-04-03 13:52:00
AI引发金融行业变革,华为公布金融行业四大战略方向
...咨询、架构规划和全面调优。”曹冲说。AI引发金融行业变革随着移动互联网的快速发展,金融业务的线上化、移动化和场景化比例越来越高,相应也带来了数据量的爆炸式增长以及复杂的数据问
2023-06-10 01:01:00
更多关于科技的资讯:
牢记嘱托开新局 日新江淮往前赶|小外壳大产业:富思佶如何跑出“全椒速度”?
大皖新闻讯 从常熟到大墅,一条生产线上的“变形记”,正在为联想、惠普等全球巨头打造最坚硬的“铠甲”。 4月14日上午,大皖新闻记者跟随“牢记嘱托开新局 日新江淮往前赶”采访团目睹了一场关于金属的“魔术变身”
2026-04-14 23:06:00
大皖新闻讯 4月14日下午,以“AI赋能跨境电商新增长”为主题的2026中国(合肥)AI赋能跨境电商峰会在合肥法务区举行
2026-04-14 23:07:00
江南时报讯 昆山农商银行以产品布局、服务赋能、生态增效的“打法”,以金融活水精准灌溉科技创新沃土。截至2025年末,该行科技型企业贷款余额183
2026-04-14 23:18:00
全信股份:立足自主创新与技术深耕
今年以来,国际地缘形势趋于复杂,内地相关行业A股公司的经营情况备受市场关注。近日,《大众证券报》记者以投资者身份参加了全信股份(300447)2025年年度股东会
2026-04-14 23:02:00
从“全量上云”到“影像通”,龙岗携手华为夯实智慧医疗数字基座
深圳新闻网2026年4月14日讯(记者 张凡)两个看似独立的医疗信息化场景,在深圳龙岗,正悄然串联成一条清晰的演进路径
2026-04-14 17:13:00
医保信用支付要来了?首批13项医保新场景清单公布
推动可穿戴手环等健康数据接入医保系统,形成个人全生命周期健康档案;“先诊疗后付费”,离院时统一结算,有望变成现实……4月14日
2026-04-14 17:23:00
轻量化便携影像检查装备即将亮相秦皇岛
河北新闻网讯(张东阳)整机重量控制在4kg以内,高清成像显著提升病灶检出率,支持人流密集场所高通量检测,人体友好型设计保障操作人员与受检者安全……一款轻量化便携影像检查装备即将亮相秦皇岛基层医疗卫生机构
2026-04-14 17:44:00
【宅男财经|专家面对面】2026江苏省城市足球联赛,即第二届“苏超”近日在常州奥体中心体育场‌开赛。中国社会科学院财经战略研究院教授魏翔接受宅男财经采访时表示
2026-04-14 17:52:00
白酒圈盲盒热?五粮液世界杯联名“隐藏款”成交价逼近三万,“以酒换金”再掀热潮
鲁网4月14日讯近期,白酒二级市场掀起“盲盒热”。第八代五粮液美加墨世界杯官方联名白酒“世界杯隐藏款”,在闲鱼、小红书等平台热度攀升
2026-04-14 19:40:00
五粮液全球短视频大赛启幕:以影像焕新品牌活力,让“大国浓香”与世界共鸣
鲁网4月14日讯当“大国浓香”邂逅数字光影潮流时,一场跨越全球的“和美”主题影像共创盛宴正式拉开帷幕。4月13日,“宜宾Action 五粉请出片”五粮液全球短视频大赛上线
2026-04-14 19:40:00
4月20日,全球首个“自动驾驶移动空间”路线——贵阳“奇遇环线”将正式启动试运营。该项目由贵阳高新区企业贵州翰凯斯智能技术有限公司联合合资公司贵州勘设泰宇坦行科技有限公司
2026-04-14 20:33:00
从“一句话创意”到“成片输出”,AI如何颠覆传统短剧制作模式?
大河网讯 当“人工智能”的算力浪潮遇见“微短剧”的蓬勃风口,会擦出怎么样的火花?4月14日下午,“智汇高新 剧创未来——郑州高新区双政策亮相暨圆桌会议”在郑州市高新区举行
2026-04-14 20:39:00
河北新闻网讯(李志云)3月上旬,工作面外围皮带进入交付倒计时,开滦集团钱家营矿业公司(简称“开滦钱矿公司”)准备工程一队锚定设备交接后满格运行目标
2026-04-14 20:45:00
纵览原创|石家庄露营经济拼出新高度,“精致餐”抢占户外新赛道
视频制作/吴淑娜(实习生)记者李瑾 宋瑶 春日露营热潮带动下,石家庄露营消费正经历从简单吃饱向精致餐饮的转变。精致餐盒
2026-04-14 20:51:00
牢记嘱托开新局 日新江淮往前赶|在合肥,量子科技正加速“飞入寻常百姓家”
大皖新闻讯 困扰百姓日常生活的信息安全痛点,在合肥有了“量子级”的解决方案。4月13日,“牢记嘱托开新局 日新江淮往前赶”采访团走进科大国盾量子技术股份有限公司
2026-04-14 21:56:00