• 我的订阅
  • 科技

Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏

类别:科技 发布时间:2024-07-18 14:57:00 来源:云间有月

?Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏

快科技6月7日消息,Intel官方宣布,旗下数据中心、客户端、边缘AI解决方案均已经为阿里云通义千问2(Qwen2)的全球发布提供支持,已取得ModelScope、阿里云PAI、OpenVINO等诸多创新成果。

为了最大限度地提升诸通义千问2等大模型的效率,Intel进行了全面的软件优化,包括高性能融合算子、平衡精度和速度的先进量化技术等。

Intel还采用KV Caching、PagedAttention机制和张量并行,提高推理效率。

Intel的硬件也可利用软件框架和工具包进行加速,并获得出色的大模型推理性能,包括PyTorch以及Intel PyTorch扩展包、OpenVINO工具包、DeepSpeed、Hugging Face库、vLLM。

Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏

首先看Intel Gaudi AI加速器,专为生成式AI、大模型的高性能加速而设计,最新版的Gaudi Optimum可以轻松部署新号的大模型。

Intel使用Gaudi 2,对70亿参数、720亿参数的通义千问2模型的推理和微调吞吐量进行了基准测试,以下为详细性能指标和测试结果:

Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏

70亿参数通义千问2在单颗Gaudi 2加速器上的推理

Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏

720亿参数通义千问2在八颗Gaudi 2加速器上的推理

Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏

通义千问2 FP8在Gaudi 2加速器上的推理

Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏

通义千问2在Gaudi 2加速器上的微调

再看Intel至强处理器,作为通用平台具有广泛的可用性,适用于各个规模的数据中心,对于希望快速部署AI解决方案、没有专项基础设施企业非常理想。

至强处理器的每个核心都内置了Intel AMX高级矩阵扩展,可以处理多样化的AI工作负载,并加速AI推理。

Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏

以上是在五代可扩展至强上运行阿里云ecs.ebmg8i.48xlarge实例,通义千问2的下一个推理token延迟情况。

最后是消费级的AI PC,可以在本地部署大模型,既然可以使用处理器内置GPU核显、NPU AI引擎,也可以搭配独立的锐炫显卡。

以下展示了AI PC运行15亿参数的通义千问2:

Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏

酷睿Ultra 7 165H上的通义千问2推理

Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏

酷睿 Ultra 7 165H上的通义千问2下一个token延迟

Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏

锐炫A770 16GB显卡上的通义千问2下一个token延迟

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-18 17:45:11

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

阿里云开源通义千问 70 亿参数模型,免费、可商用
据36氪报道,今日阿里云开源通义千问70亿参数模型,包括通用模型Qwen-7B和对话模型Qwen-7B-Chat,两款模型均已上线魔搭社区,开源、免费、可商用。此举让阿里云成为国
2023-08-03 17:18:00
阿里云通义千问开源!70亿参数模型上线魔搭社区
...Scope上架两款开源模型Qwen-7B和Qwen-7B-Chat,阿里云确认其为通义千问70亿参数通用模型和对话模型
2023-08-03 17:00:00
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
通义大模型发布一周年之际,迎来重要的历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo
2024-05-09 12:00:00
从云栖大会,看阿里的科技本色
...巴巴宣布了自研大模型的最新进展——千亿级参数规模的通义千问 2.0 正式发布。阿里巴巴宣布,通义千问 2.0 在 10 个权威测评中全面超越 GPT-3
2023-11-01 23:02:00
本文转自:新华网12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练
2023-12-01 13:33:00
阿里云通义千问大模型首批通过备案,正式向公众开放
9月13日消息,阿里云今日宣布通义千问大模型已首批通过备案,并正式向公众开放。IT之家小伙伴可登录通义千问官网(https://qianwen
2023-09-13 15:15:00
MediaTek携手阿里云在天玑移动平台完成通义千问大模型端侧部署
...与阿里云达成深度合作,双方在天玑9300移动平台上完成通义千问大模型小尺寸版本的端侧部署,该部署可适配天玑8300移动平台,可实现离线状态下即时且精准的多轮人机对话问答。未来
2024-03-28 15:35:00
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
时隔一个月,通义千问又放大招了!在一个月前的阿里云栖大会上,阿里正式发布通义千问2.0版本,在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上,都有较大提升。并且,阿
2023-12-01 21:07:00
通义千问发布半年,大模型已不是阿里云唯一主角 | 焦点分析
...又无处不在。做AI时代的“电动机” 今年4月正式亮相的通义千问,是阿里云自研的底层通用大模型。半年过去,如今阿里云正式推出通义千问的2.0版本,参数已达千亿,在各项评测集中,
2023-11-03 14:33:00
更多关于科技的资讯:
新春佳节,当千家万户沉浸在团圆的喜悦中时,在宁波,有这样一群人,他们为了赶订单、保交付,选择坚守生产一线。据统计,今年春节期间
2026-02-23 17:31:00
定义AI数字化增长服务新模式 数织沅码亮相多地春晚舞台
2026年春节,AI驱动企业全球数字化增长的专业服务平台——数织沅码登陆江苏卫视、浙江卫视等多地春晚舞台,完成首次公开亮相
2026-02-23 11:47:00
中国科技品牌绿联推进充电宝品质升级,让充电更安心
对用户而言,充电宝早已不是偶尔应急的配件,而是通勤、差旅、校园与户外场景中的常备装备。行业也普遍认为,当快充普及、多设备协同成为日常
2026-02-23 13:11:00
引言:腥风血雨已至,智能体元年全面爆发2026年的春天,人工智能领域正经历一场前所未有的变革。当全球科技巨头仍在为生成式AI的迭代速度激烈竞逐时
2026-02-23 13:12:00
以武会春,宇树春晚机器人马年秀出“赛博真功夫”
新春启序,万象更新。在中央广播电视总台2026年春晚舞台上,宇树科技作为春晚机器人合作伙伴第三次登台亮相,携G1与H2人形机器人献上全球首次全自主人形机器人集群武术表演(带集群快速跑位)
2026-02-23 11:47:00
大年初六,位于余杭区“中国飞谷”的重隼智能科技(浙江)有限公司马力全开,以开局即冲刺的姿态,奋力跑出新年发展第一棒。“作为一家深耕无人机具身智能集成创新的科技型企业
2026-02-23 07:58:00
2月20日上午9时,太原武宿综合保税区A座环球优选品牌店的大门准时开启,300余款新春礼盒整齐排列,品类丰富,琳琅满目
2026-02-23 07:29:00
“十五五”开局看河北|淡季不淡,冀东普天产销两旺
新年首月销售额近8000万元,同比增长14.3%淡季不淡,冀东普天产销两旺1月26日,冀东普天线缆有限公司工人正在优化生产设备
2026-02-23 07:37:00
河北日报讯(记者孙也达)2月14日,秦皇岛晟成自动化设备有限公司生产的全球首台套出口型电磁加热多层层压机完成拆解,运往美国
2026-02-23 07:48:00
双轮驱动,智启未来:刘晓春与AI智能体×机器人“姊妹组合战略”的全球布局
2026,智能时代的分水岭2026年的春天,马年春晚的舞台上,一场科技盛宴惊艳了全球观众——30多台国产机器人协同起舞
2026-02-22 12:05:00
新春走基层丨厦企加快数字化转型步伐 提前返岗忙生产赶订单
明翰电气的工人春节期间坚守岗位。(记者 林铭鸿 摄)厦门网讯(厦门日报记者 林露虹)放置材料、调试机台……正月初五,厦门明翰电气股份有限公司(以下简称“明翰电气”)已忙碌起来
2026-02-22 08:50:00
新春走基层 | 森一量子为赶订单全员在线 生产线满负荷运转
昨日记者走进森一量子,这一企业春节期间全员加班加点。厦门网讯(厦门日报记者 李晓平)长晶、 切割、减薄、抛光、镀膜……当大多数人还沉浸在春节的喜庆中
2026-02-22 08:50:00
我带着一款AI眼镜回家过年
记者带回家的AI眼镜二伯买的宇树机器狗Go2今年的春晚有一个格外醒目的变化——“AI含量”明显提升。年夜饭桌上,亲戚们都在聊各自手机里的各种“AI”App
2026-02-22 07:49:00
中国科大实现碳化硅改性双空位色心的电荷态调控
大皖新闻讯 2月21日,大皖新闻记者从中国科学技术大学获悉,该校郭光灿院士团队在碳化硅改性双空位色心电荷态调控的研究中取得了新进展
2026-02-21 16:48:00
戛纳世界人工智能大会探讨“音乐人工智能”
中国青年报客户端讯(中青报·中青网记者 蒋肖斌)2026戛纳世界人工智能大会(WAICF 2026),近日在法国戛纳举办
2026-02-21 12:10:00