• 我的订阅
  • 科技

支持160亿参数大语言模型 英特尔让轻薄本也能玩转AIGC

类别:科技 发布时间:2023-08-24 21:52:00 来源:卓越科技

随着Chat GPT的大热,AIGC成为当下人工智能领域最热门的发展方向,基于AI大模型的训练,利用现有的数据、算法和算力,生成更多数据或进行创作等等。但不管是大家熟知的ChatGPT,还是百度的文心一言,都是需要强大的云端算力所支撑才能实现。而与那些依靠遥远的云端算力不同,英特尔则致力于让生成式AI在个人电脑上落地,通过本地设备的算力来实现这些。

在今年早些时候的一次技术分享会上,英特尔曾展示过基于OpenVINO,AI绘图开源模型Stable Diffusion可以使用开源图片编辑软件GIMP,在英特尔锐炫A750、A770等显卡上流畅运行,通过输入简单的文字,仅需很短的时间变可以实现创意绘图,帮助用户提升效率。

而最近的技术分享会上,英特尔更加详细的展示了它们在端侧AIGC的布局和成果,它们提供了从硬件到软件的全面支持。首先是硬件层面,以目前第12代、第13代英特尔酷睿处理器和英特尔锐炫A系列显卡为代表的英特尔多款客户端芯片,都可以满足生成式AI(AIGC)对于高算力的需求。同时,英特尔还通过软件生态的构建和模型优化,进一步推动新兴的生成式AI场景在个人电脑的落地,广泛覆盖轻薄本、全能本、游戏本等个人PC设备上。

支持160亿参数大语言模型 英特尔让轻薄本也能玩转AIGC

英特尔基于OpenVINOPyTorch后端的方案,通过PytorchAPI让社区开源模型能够很好地运行在英特尔的客户端处理器、集成显卡、独立显卡和专用AI引擎上。像刚刚提到的StableDiffusion,已经能通过上述方式,在英特尔客户端平台的CPU和GPU(包括集成显卡和独立显卡)上运行FP16精度的模型,用户可以在文字生成图片、图片生成图片以及局部修复等功能上获得良好的使用体验。

支持160亿参数大语言模型 英特尔让轻薄本也能玩转AIGC

除此之外,英特尔还通过模型优化,降低了模型对硬件资源的需求,进而提升了模型的推理速度,让社区开源模型能够很好地运行在个人电脑上。英特尔通过第13代英特尔酷睿处理器XPU的加速、low-bit量化以及其它软件层面的优化,让最高达160亿参数的大语言模型,通过BigDL-LLM框架运行在16GB及以上内存容量的个人电脑上,这点实属不易了。尽管相比于GPT-3高达1750亿的参数量还有着数量级的差距,但毕竟它靠的只是一台个人电脑,而GPT-3的背后可是上万颗英伟达V100芯片。

英特尔适应了当下快速发展的大语言模型,兼容目前HuggingFace上的Transformers模型。已经验证过的模型包括但不限于:LLAMA/LLAMA2、ChatGLM/ChatGLM2、MPT、Falcon、MOSS、Baichuan、QWen、Dolly、RedPajama、StarCoder、Whisper等。此外,英特尔还提供了易用的API接口(Transformers、LangChain),并支持Windows、Linux的操作系统。

在活动现场,笔者看到了依靠PC端侧算力的一些AIGC的演示案例,比如在一台搭载酷睿i7-13700K+ArcA750显卡的台式机上(选择ChatGLM2-6b模型),就可以实现非常丰富的功能,像聊天助手、情感分析、故事创作等,生成文字回答的速率都比较理想。在聊天助手功能下,它做到了首个token firstlatency时间为215.3ms,后续Afterlatency为55.63ms/token,生成的速度完全可以追上普通人的阅读速度,体验还是OK的。之后还测试了情感分析功能,firstlatency时间为249.8ms,Afterlatency56.01ms/token,生成速度同样蛮快的。而在Stable Diffusion的图片生成这块,512x512分辨率的一张图耗时在2秒左右。

支持160亿参数大语言模型 英特尔让轻薄本也能玩转AIGC

前段时间,Tom'sHardware还使用Automatic1111WebUIOpenVINO测试了ArcA77016GB和ArcA750的AI性能。与5月份相比,两款显卡8月份的测试结果发生了很大的变化,与之前均落后于RTX4060不同,如今它们均实现了一定幅度的超越,而且ArcA77016GB已经接近RTX4060Ti了。两者在硬件性能这块是肯定不如RTX4060的,而AI性能的领先应该要得益于英特尔在软件层面的持续优化。

支持160亿参数大语言模型 英特尔让轻薄本也能玩转AIGC

当然,除了搭载独显的台式机能够玩AIGC外,轻薄本一样是OK的,现场这台设备搭载了酷睿i7-13700H处理器,拥有96EU的IrisXe核显,同样能够通过基于AI绘图开源模型Stable Diffusion使用开源图片编辑软件生成图片,一张512x512分辨率的图片生成花费的时间为17秒左右,相比于ArcA770独显的2秒算不上快,复杂的描述则需要等待更长的时间。我觉得基本在可用的这个级别上,对于这样一台轻薄本来说已经非常不容易了。

支持160亿参数大语言模型 英特尔让轻薄本也能玩转AIGC

值得一提的是,英特尔的下一代处理器MeteorLake具备独特的分离式模块架构的优势,为PC用户提供了以AI驱动的新功能,像AdobePremierePro中的自动重新构图和场景编辑检测等多媒体功能,并实现更有效的机器学习加速。它们会和产业合作伙伴一起向着规模化应用AI加速转型的方向前行,后续几代产品也将继续拓展AI能力,让更多享受到AI所带来的体验升级。

写在最后

目前来看,英特尔在终端侧AIGC这块已经进行了非常多的布局,致力于推动生成式AI在个人PC上的落地,它们不仅提供了强大的硬件基础,还通过模型优化降低硬件资源的需求,让更多开源模型能够运行在个人PC上,13代酷睿处理器已经能够支持高达160亿参数的大语言模型。从现场的演示可以看出,我觉得目前端侧的AIGC已经具备了一定的可用性和应用场景,下一步则需要去落实到具体的应用和功能上,在实际的场景中发挥作用。英特尔也表示,目前正与PC产业众多合作伙伴通力合作,致力于让广大用户在日常生活和工作中,通过AI的辅助来提高效率,进而带来给革新性的PC体验,大家可以期待一下。

举报/反馈

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-25 00:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

酷睿轻薄本也能运行大语言模型,英特尔推动pc生成式ai落地
2023年8月18日上午,英特尔在大湾区举办了一场技术分享会,主题是英特尔在AIGC(人工智能生成式计算)领域的最新进展。会上,英特尔的技术专家向与会者展示了他们在AIGC上的技
2023-08-24 22:38:00
ai改变世界?英特尔轻薄本体验测试
...到整个行业越来越多的关注。而这其中,作为芯片巨头的英特尔就一直是终端侧AIPC的前沿探索者。早在2018年,英特尔就提出要在PC上引入AI
2023-11-14 15:16:00
英特尔预计2024年正式上市Gaudi3,用于生成式AI模型
12月15日,英特尔在北京举办新品发布会。记者在发布会现场获悉,此次英特尔推出的英特尔®酷睿™Ultra处理器系列采用了新的Intel4制程工艺;第五代英特尔®至强®可扩展处理器
2023-12-15 22:53:00
英特尔aigc在pc上的应用
...上的落地和应用,这里就不得不提到一个重要的推动者:英特尔。早在2018年,英特尔就曾判断PC会是未来AI的主战场,并推出了“AIonPCDeveloperProgram”的AIPC开发者计划
2023-11-24 09:47:00
英特尔发布全新软硬件平台,全速助力企业推进AI创新
中关村在线消息,美国当地时间4月9日,英特尔举办了面向客户和合作伙伴的英特尔on产业创新大会,宣布了英特尔至强6处理器的全新品牌,推出英特尔Gaudi3加速器,以高性能、开放性和
2024-04-10 17:08:00
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...正在研发方面投入大量资金,以实现这一目标。(界面)英特尔预告Gaudi 3将超越H100,发布新一代AI数据中心和PC芯片英特尔宣布推出一系列AI新品
2023-12-18 22:02:00
AI PC 竞争加剧,但普及加速还是要靠英特尔
...进一步加大了消费者购买一台高性能 AI PC 的难度。反观英特尔这边,酷睿品牌的焕新升级之后,全新的酷睿 Ultra 带来了清晰的产品线规划
2023-12-07 13:38:00
英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!
12月15日下午,英特尔在中国北京召开了主题为“AI无处不在,创芯无所不及”的2023英特尔新品发布会暨AI技术创新派对
2023-12-16 13:49:00
英特尔AI PC半年“答卷”:三大AI引擎驱动
【天极网笔记本频道】AI PC,英特尔CEO帕特・基辛格在去年九月份提出了这个概念。什么是AI PC?他的答案是能够玩转AI功能的PC,可通过云与PC的紧密协作,或在电脑端独立运
2024-04-04 15:01:00
更多关于科技的资讯: