• 我的订阅
  • 科技

NVIDIA RTX显卡AI推理提速5倍!

类别:科技 发布时间:2023-11-16 20:13:00 来源:瘦子财经

11月16日消息,正在举行的微软Iginte全球技术大会上,微软发布一系列AI相关的全新优化模型、开发工具资源,帮助开发者更深入地释放硬件性能,拓展AI场景。

尤是对于当下在AI领域占据绝对主导地位的NVIDIA来说,微软这次送上了一份大礼包,无论是面向OpenAIChatAPI的TensorRT-LLM封装接口,还是RTX驱动的性能改进DirectMLforLlama2,以及其他热门大语言模型(LLM),都可以在NVIDIA硬件上获得更好的加速和应用。

NVIDIA RTX显卡AI推理提速5倍!

其中,TensorRT-LLM是一款用于加速LLM推理的库,可大大提升AI推理性能,还在不断更以支持越来越多的语言模型,而且它还是开源的。

就在10月份,NVIDIA也发布了面向Windows平台的TensorRT-LLM,在配备RTX30/40系列GPU显卡的台式机、笔记本上,只要显存不少于8GB,就可以更轻松地完成要求严苛的AI工作负载。

现在,TensorRT-LLMforWindows可以通过全新的封装接口,与OpenAI广受欢迎的聊天API兼容,因此可以在本地直接运行各种相关应用,而不需要连接云端,有利于在PC上保留私人和专有数据,防范隐私泄露。

只要是针对TensorRT-LLM优化过的大语言模型,都可以与这一封装接口配合使用,包括Llama2、Mistral、NVLLM,等等。

对于开发者来说,无需繁琐的代码重写和移植,只需修改一两行代码,就可以让AI应用在本地快速执行。

NVIDIA RTX显卡AI推理提速5倍!

↑↑↑基于TensorRT-LLM的微软VisualStudio代码插件——Continue.dev编码助手

本月底还会有TensorRT-LLMv0.6.0版本更新,将会在RTXGPU上带来最多达5倍的推理性能提升,并支持更多热门的LLM,包括全新的70亿参数Mistral、80亿参数Nemotron-3,让台式机和笔记本也能随时、快速、准确地本地运行LLM。

根据实测数据,RTX4060显卡搭配TenroRT-LLM,推理性能可以跑到每秒319tokens,相比其他后端的每秒61tokens提速足足4.2倍。

RTX4090则可以从每秒tokens加速到每秒829tokens,提升幅度达2.8倍。

NVIDIA RTX显卡AI推理提速5倍!

基于强大的硬件性能、丰富的开发生态、广阔的应用场景,NVIDIARTX正成为本地端侧AI不可或缺的得力助手,而越来越丰富的优化、模型和资源,也在加速AI功能、应用在上亿台RTXPC上的普及。

目前已经有400多个合作伙伴发布了支持RTXGPU加速的AI应用、游戏,而随着模型易用性的不断提高,相信会有越来越多的AIGC功能出现在WindowsPC平台上。

NVIDIA RTX显卡AI推理提速5倍!

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-11-17 00:45:10

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

13代酷睿支持160亿参数大模型、Arc显卡提速54%
生成式AI(AIGC)无疑是当下最热门的话题和应用,各家软硬件厂商都在全力投入。作为拥有强大硬件、广泛生态的行业领袖,Intel也正在大力推动PCAIGC应用的落地
2023-08-20 17:00:00
手机跑大模型提速4-5倍!微软亚研院开源新技术,有CPU就行
有CPU就能跑大模型,性能甚至超过NPU/GPU!没错,为了优化模型端侧部署,微软亚洲研究院提出了一种新技术——T-MAC。这项技术主打性价比,不仅能让端侧模型跑得更快,而且资源
2024-08-10 09:52:00
从狂热到理性:大模型训练三堵墙,一场少数人的游戏 | 钛媒体深度
...的地方需要加速,像通信需要加速、显存需要压缩、整个推理也需要加速。百度智能云能够把调优手段集成到基础库,对于大模型计算和推理非常有帮助。”谢广军说。从平台的视角来说,不管是训
2023-06-29 12:00:00
面壁智能的端侧大模型面壁MiniCPM正式亮相
...大的底层支撑,先是算力方面,凭借全流程高效infra10倍推理加速,能够将成本降低90%;其次在算法方面,面壁模型通过高效模型训练配置实现模型能力快速形成;数据处理方面,凭借
2024-02-01 21:36:00
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instruct可胜任复杂推理任务
2024-08-22 09:49:00
英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场
...的H100的带宽和容量分别为3.35TB和80GB。这将提升大模型在推理方面的表现,并有助于提升高性能计算应用的计算能力。英伟达预计,H200将在明年二季度开始发货,谷歌、微
2023-11-14 14:05:00
微软研究院推出orca2llm
...然后生成、回忆-原因-生成、提取-生成和直接回答等各种推理技术,同时还能为不同的任务选择不同的解决方案策略。Orca2模型相比较Llama2和WizardLM等大型语言模型
2023-11-22 11:08:00
微软开源爆火1bit大模型推理框架!千亿参数模型量化后单CPU可跑
微软开源1bit大模型推理框架!现在1000亿参数大模型量化后单CPU可跑,速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现
2024-10-23 12:05:00
专家模型不要专家并行!微软开源MoE新路径
...好,所以要在左上角: GRIN作为MoE架构,总参数量约42B,推理时激活的参数为6.6B,打同级别(7B)的非MoE模型是手拿把攥
2024-11-12 09:57:00
更多关于科技的资讯:
本文转自:人民网-贵州频道近日,贵阳大数据科创城多边超算基地项目《装配式混凝土空腹夹层板》新技术,顺利通过贵州省住房和城乡建设厅组织的专家评审
2025-04-21 19:52:00
台积电CEO魏哲家2024年薪酬2.13亿元:大涨70%
快科技4月21日消息,台积电在最新的2024年财报中,公布了台积电董事长兼总裁魏哲家及多位高管的薪酬。2024年,魏哲家总薪酬超过9
2025-04-21 19:59:00
零百加速5.7秒!长城汽车:魏牌高山是性能最强的插混MPV
快科技4月21日消息,在魏牌新高山的发布会上,长城汽车宣布魏牌高山是性能最强的插混MPV。在Hi4系统的助力下,魏牌高山的满电0-100公里/小时加速时间仅为5
2025-04-21 19:59:00
‌黄伟健教授荣耀加盟欧洲经济研究院
在学术与科研的璀璨星空中,又有一颗耀眼的星辰加入了欧洲经济研究院的大家庭。他就是黄伟健教授,一位在工商管理和商业人工智能领域深耕多年的杰出学者
2025-04-21 20:10:00
姚小毅:商业管理与人工智能领域的杰出专家
姚小毅,一位在商业管理和商业人工智能领域享有盛誉的专家,以其深厚的学术背景和卓越的贡献,成为了连接中西学术交流与合作的重要桥梁
2025-04-21 20:14:00
本文转自:人民网-观点频道孟 哲打开手机购物APP,映入眼帘的商品推荐常常正中下怀,仿佛平台能洞悉你的内心;刷短视频时
2025-04-21 20:17:00
南宁职业技术大学与南宁中关村信息谷科技签订战略合作协议
本文转自:人民网-广西频道签约现场。主办方供图4月20日,千企南宁行——南宁·中关村人工智能+国际创新生态大会活动举行
2025-04-21 20:21:00
全面超越旧时代豪华MPV 全新魏牌高山预售:顶配仅需37.98万
快科技4月21日消息,刚刚,全新魏牌高山开启预售,号称全面超越旧时代豪华MPV,分为高山7/8/9三个版本,共推出3款车型
2025-04-21 20:29:00
友商沉默!vivo X200 Ultra为何拍照这么强:图像传感器平均面积大幅领先
快科技4月21日消息,今晚vivo在线上举行新品发布会,而备受期待的X200 Ultra也是终于亮相。作为X200 Ultra最大的看点
2025-04-21 20:29:00
国补679.15元起!vivo WATCH 5发布:血压风险评估 全新自研蓝河OS
快科技4月21日消息,今晚,vivo新一代智能手表——vivo WATCH 5正式发布,主打健康监测与轻量化设计。vivo WATCH 5提供辰夜黑
2025-04-21 20:29:00
中粮可口可乐“聚势共生 链通未来”共赢生态圈正式发布
大众网记者 段正浩 济宁报道4月14日,中粮可口可乐饮料有限公司(以下简称“中粮可口可乐”)举行“聚势共生 链通未来”共赢生态圈战略发布会
2025-04-21 20:51:00
吉尔、艾达同框!《生化危机》系列女主全家福来了
X上一位同人画师(@es_nio_arts)以其精湛的Blender创作俘获了大量粉丝。这位同人画师通过3D建模软件Blender
2025-04-21 20:59:00
能打电话的V单!vivo X200 Ultra发布:6499元起
快科技4月21日消息,今日晚间,vivo X200 Ultra正式发布。售价方面,12GB+256GB售价6499元;16GB+512GB售价6999元
2025-04-21 20:59:00
刘强东亲自送外卖与消费者合影 京东回应:属实
快科技4月21日消息,今晚,有网友在小红书发帖,晒出与京东创始人刘强东合影。照片中刘强东身穿京东外卖骑手工服,手持外卖
2025-04-21 20:59:00
让机器人做家务、与机器人对弈、机器人来问诊……4月19日至20日,由环梦科技、中科检测、云之谷科技共同主办的2025环梦•Ai智能机器人科普展太原站
2025-04-21 21:10:00