我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿捏

类别：科技发布时间：2024-07-18 14:57:00 来源：云间有月

?Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿捏

快科技6月7日消息，Intel官方宣布，旗下数据中心、客户端、边缘AI解决方案均已经为阿里云通义千问2（Qwen2）的全球发布提供支持，已取得ModelScope、阿里云PAI、OpenVINO等诸多创新成果。

为了最大限度地提升诸通义千问2等大模型的效率，Intel进行了全面的软件优化，包括高性能融合算子、平衡精度和速度的先进量化技术等。

Intel还采用KV Caching、PagedAttention机制和张量并行，提高推理效率。

Intel的硬件也可利用软件框架和工具包进行加速，并获得出色的大模型推理性能，包括PyTorch以及Intel PyTorch扩展包、OpenVINO工具包、DeepSpeed、Hugging Face库、vLLM。

首先看Intel Gaudi AI加速器，专为生成式AI、大模型的高性能加速而设计，最新版的Gaudi Optimum可以轻松部署新号的大模型。

Intel使用Gaudi 2，对70亿参数、720亿参数的通义千问2模型的推理和微调吞吐量进行了基准测试，以下为详细性能指标和测试结果：

70亿参数通义千问2在单颗Gaudi 2加速器上的推理

720亿参数通义千问2在八颗Gaudi 2加速器上的推理

通义千问2 FP8在Gaudi 2加速器上的推理

通义千问2在Gaudi 2加速器上的微调

再看Intel至强处理器，作为通用平台具有广泛的可用性，适用于各个规模的数据中心，对于希望快速部署AI解决方案、没有专项基础设施企业非常理想。

至强处理器的每个核心都内置了Intel AMX高级矩阵扩展，可以处理多样化的AI工作负载，并加速AI推理。

以上是在五代可扩展至强上运行阿里云ecs.ebmg8i.48xlarge实例，通义千问2的下一个推理token延迟情况。

最后是消费级的AI PC，可以在本地部署大模型，既然可以使用处理器内置GPU核显、NPU AI引擎，也可以搭配独立的锐炫显卡。

以下展示了AI PC运行15亿参数的通义千问2：

酷睿Ultra 7 165H上的通义千问2推理

酷睿 Ultra 7 165H上的通义千问2下一个token延迟

锐炫A770 16GB显卡上的通义千问2下一个token延迟

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-07-18 17:45:11

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于三条,通义,阿里,模型,参数,通义的资讯：

阿里云开源通义千问 70 亿参数模型，免费、可商用

据36氪报道，今日阿里云开源通义千问70亿参数模型，包括通用模型Qwen-7B和对话模型Qwen-7B-Chat，两款模型均已上线魔搭社区，开源、免费、可商用。此举让阿里云成为国

2023-08-03 17:18:00

阿里云通义千问开源！70亿参数模型上线魔搭社区

...Scope上架两款开源模型Qwen-7B和Qwen-7B-Chat，阿里云确认其为通义千问70亿参数通用模型和对话模型

2023-08-03 17:00:00

阿里云发布通义千问2.5，性能赶超GPT-4 Turbo

通义大模型发布一周年之际，迎来重要的历史性时刻。5月9日，阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4 Turbo

2024-05-09 12:00:00

从云栖大会，看阿里的科技本色

...巴巴宣布了自研大模型的最新进展——千亿级参数规模的通义千问 2.0 正式发布。阿里巴巴宣布，通义千问 2.0 在 10 个权威测评中全面超越 GPT-3

2023-11-01 23:02:00

720亿参数模型开源通义千问已实现“全尺寸、全模态”开源

本文转自：新华网12月1日，阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练

2023-12-01 13:33:00

阿里云通义千问大模型首批通过备案，正式向公众开放

9月13日消息，阿里云今日宣布通义千问大模型已首批通过备案，并正式向公众开放。IT之家小伙伴可登录通义千问官网（https://qianwen

2023-09-13 15:15:00

MediaTek携手阿里云在天玑移动平台完成通义千问大模型端

...与阿里云达成深度合作，双方在天玑9300移动平台上完成通义千问大模型小尺寸版本的端侧部署，该部署可适配天玑8300移动平台，可实现离线状态下即时且精准的多轮人机对话问答。未来

2024-03-28 15:35:00

通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-

时隔一个月，通义千问又放大招了！在一个月前的阿里云栖大会上，阿里正式发布通义千问2.0版本，在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上，都有较大提升。并且，阿

2023-12-01 21:07:00

通义千问发布半年，大模型已不是阿里云唯一主角 | 焦点分析

...又无处不在。做AI时代的“电动机” 今年4月正式亮相的通义千问，是阿里云自研的底层通用大模型。半年过去，如今阿里云正式推出通义千问的2.0版本，参数已达千亿，在各项评测集中，

2023-11-03 14:33:00

更多关于科技的资讯：

乌山时评｜“晓风”再起拂动人心

近日，一则令不少书友激动的消息传遍福州人的朋友圈——晓风书屋即将在鼓屏路旧址重启。为何“晓风”再起，依旧能拂动人心？要知道

2026-01-10 08:14:00

AI陪练面试、AI帮筛简历招聘市场“AI味”更重了

厦门网讯（厦门日报记者何无痕）当前，招聘市场的“AI味”越来越浓。近日，记者调查发现，如今企业不再依赖传统的选才，开始尝试更智能

2026-01-10 08:30:00

@杭州人，你的信用能换钱了！

最近，杭州人的“信用幸福指数”又上涨了！信用消费专区在杭州市民卡App上线，用户凭钱江分就能享受信用消费折扣、体验低空文旅的乐趣

2026-01-10 09:19:00

新春雅集财安相伴——邮储银行VIP客户插花暨金融反诈便民活

近日，邮储银行高新区支行以花为媒、以情相连，精心举办“花漾时光·金融护航”VIP客户专属插花沙龙活动，活动将花艺美学体验

2026-01-10 09:51:00

中亦科技以 IT 运维筑牢半导体产业增长之基

最近，半导体行业的目光都聚焦在一条“疯狂”的曲线上：内存价格。这绝非一次简单的周期性波动。深层驱动力是以人工智能应用落地引发的“以存代算”技术范式革命

2026-01-10 09:51:00

每周三周六10:30开抢贵州家电数码购新补贴券1月10日起

1月8日，贵州省商务厅发布《关于发放家电产品以旧换新、数码和智能产品购新活动补贴券相关事项的公告》（下称《公告》），明确2026年贵州家电产品以旧换新

2026-01-09 23:02:00

整治伪智能要下真功夫

人工智能、物联网与5G技术的成熟迭代，让智能家居家电产品从高端小众走向大众消费，成为现代家庭标配。近日，江苏省消费者权益保护委员会发布专项调查报告

2026-01-09 17:10:00

动漫周边衍生品热销

动漫周边行业作为文化产业的重要组成部分，近年来呈现出快速发展的态势。近日，记者走访位于北京王府井的一家大型动漫主题实体店发现

2026-01-09 17:10:00

“冻鲜互变”仍保鲜保税区进口牛肉凭啥这么牛？

大河网讯进口冰冻牛肉，由冻转鲜，再由鲜转冻……虽经多次变身，仍然“鲜”活诱人，这里的牛肉凭啥这么牛？1月8日，记者走进郑州新郑综合保税区首个生鲜产品加工项目——省重点项目南洋优鲜超级工厂

2026-01-09 17:18:00

《文旅短剧活力城市指数》发布太原入选“最具创新价值城市”榜

《文旅短剧活力城市指数》年度报告日前发布，太原和重庆、大同、东莞等8座城市入选“最具创新价值城市”榜单。《文旅短剧活力城市指数》(简称《指数》)由中国人民大学新闻学院

2026-01-09 17:58:00

张宣科技：智维创新赋能氢冶金高效运行

河北新闻网讯（郭晓通、王杨、范俊慧）全球首例120万吨氢冶金示范工程一期项目高效运行，背后有着设备维护创新硬核支撑的努力

2026-01-09 18:13:00

贵定税务：“全链条服务”点亮眼镜零售行业“睛”彩路

多彩贵州网讯 “现在付款后消费者自己在手机上动动手指就能收到发票，节省了消费者的时间，也节约了我们的人力，税务部门的管理服务让我们经营更便捷了

2026-01-09 17:23:00

【劲牌故事荟大家谈友好】“四个友好”引领劲牌构建健康可持续

□谭金山（湖北省社科联“文安平”团队、宜昌市西陵区市场监管局）企业的发展如同时代浪潮中的一叶扁舟，既需乘风破浪，更需掌舵定向

2026-01-09 14:15:00

UU远程2026远程协助重磅升级：被控免登录、自定义验证码等

引言：网易UU远程2026年即将迎来远程协助升级三连，远程协助功能实现多场景全面升级近日，网易 UU 远程迎来 2026 年首次重磅版本更新

2026-01-09 14:18:00

清华大学携手阿里巴巴共筑AI安全防线启动大模型与智能体安全

近日，阿里巴巴集团与清华大学签订协议，启动智能体与多模态安全产学研深度融合专项合作。双方此次合作为期5年，聚焦中国AI用户在真实应用场景中面临的核心安全挑战

2026-01-09 14:23:00

头条订阅服务

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿捏