• 我的订阅
  • 科技

pytorchtorchao正式发布,提供了一系列优化工具集

类别:科技 发布时间:2024-10-03 02:58:00 来源:浅语科技

10月2日消息,据PyTorch新闻稿,PyTorch旗下架构优化库torchao现已正式发布,该优化库主要专注于模型的量化和稀疏性优化,能够在保证性能的同时降低模型的计算成本和RAM用量,从而提升模型运行效率,IT之家附GitHub页面地址(点此访问)。

据介绍,torchao提供了一系列优化工具集,可以帮助LLaMA3等流行的AI模型提升性能,其支持float8、int4等低精度数据类型,能够有效减少硬件开销和RAM用量。

pytorchtorchao正式发布,提供了一系列优化工具集

官方举例,在LLaMA370B模型的预训练中,torchao提供的float8训练流程可将模型计算速度提升1.5倍。开发者只需利用convert_to_float8_training函数,即可将模型训练转换为float8,从而轻松实现模型高效训练。

在推理方面,torchao提供多种量化方法,包括权重量化(Weight-OnlyQuantization)和动态激活量化(DynamicActivationQuantization),用户可以自有选择适合的量化策略,以获得最佳的模型推理性能。

在稀疏性优化方面,torchao可以优化模型参数计算效率,据称可让ViT-H模型的推理速度提升5%。同时,torchao还可以将权重量化为int4,并将键值缓存量化为int8,可令LLaMA3.18B在完整的128K上下文长度下仅占用18.9GB的显存。

pytorchtorchao正式发布,提供了一系列优化工具集

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-10-03 08:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

360智脑7b参数模型采用3.4万亿tokens训练
...除模型权重外,该模型的微调训练代码,推理代码等全套工具集也被一并开源,大模型相关开发者可做到“开箱即用”。据IT之家此前报道,周鸿祎曾表示,前段时间大模型行业卷文本长度,10
2024-04-14 01:04:00
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...的应用程序。支持30秒无代码生成AI Bot,并且集成了插件工具集,满足用户的个性化需求。另外,Coze也对大众开放了GPT商店
2024-02-05 11:37:00
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...供高性能全场景推理算力,产品预置了完备的大模型推理工具集,可大幅提高部署运维大模型推理应用的便利性,通过重构算子等一系列深度优化,极大提升推理算力效率,释放极致推理算力性能。
2024-04-11 10:30:00
...心一言”的核心技术,大模型插件为大家提供了插件开发工具集,可以进行信息服务类、工具类以及基于大语言模型创新类的插件开发。通过平台接入之后,可以和应用层生态进行紧密结合。吴甜还
2023-08-21 07:34:00
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...虹科技(688039)1月5日互动平台表示,公司拥有自研的AIGC工具集,发布了以静态照片生成三维体积视频的方案,并且通过点云模型转换及压缩算法实现高达800倍的视觉无损压缩
2024-02-19 08:10:00
...上下文记忆、知识/库表索引、Prompt工程、Agent执行、通用工具集等扩充大模型的存储记忆、适配应用和调度执行能力,再结合财税、人力、供应链、研发等领域的知识和最佳实践扩
2023-07-28 20:52:00
谈大模型免费和被美双重制裁,周鸿祎“诉苦\
...模型内置进“AI助手”;第二,360AI办公一站式学习办公工具集发布。对于入口级的“AI助手”产品,这里的15家大模型厂商包括智谱AI、商汤科技、百川智能、火山引擎、百度智能
2024-08-05 14:20:00
aiforscience:用人工智能催化一场新的“科学革命”
...科研问题。”向辉说。一路发展至今,百度飞桨AIforScience工具集已能支持AI方法与基础学科方法交叉融合,最大的特点在于能突破基础学科中“基于数值计算求解控制方程”面临
2023-01-01 14:42:00
浪潮海岳软件重磅升级,“软件+AI”助力全场景数字化
...提供数据管理、模型训练、评估优化、插件扩展等一系列工具集,拥有语言理解、逻辑推理、代码生成、内容创作等能力,具备多模型接入、多任务编排、低门槛使用、知识库管理、全场景覆盖、安
2023-09-08 17:05:00
更多关于科技的资讯:
蔡高民:颠覆认知!打破西方理论垄断!中国老年学自主知识体系诞生
《全生命周期养能力发展与医养结合:理论和实践》的核心突破,在于建构“养”的元概念、定义与内涵外延,并以此为基础构建了逻辑自洽的三大理论体系
2026-01-04 20:15:00
编者按:周期更迭,变量叠加。站在“十五五”开局之年的关键节点上,各行业如何调整节奏、校准路径、寻找增量?中新经纬广邀多领域学者
2026-01-04 20:21:00
春节临近,年味渐浓。在贵阳,一场不同于传统年货市集的新春活动正在酝酿——它以“创意游乐场”为定位,融合在地风物、潮流文化与青年创造力
2026-01-04 21:50:00
不经意晃动手机,软件立即跳转购物页面。最近,记者实测发现,备受诟病的“摇一摇跳转”广告乱象依然时有发生,困扰着不少用户
2026-01-04 17:59:00
2025年度帆书APP经典热搜榜,精准解锁经典中的成长指南
当“信息过载”成为常态,“选择困难”深入骨髓,我们比任何时候都更需要一个清晰的信号:什么才是值得投入时间的真知?近日,帆书APP根据全年用户收听数据发布的“经典热搜榜”
2026-01-04 14:25:00
黄鹤权据光明网报道,英国《剑桥词典》将2025年年度词汇定为“准社交”,形容个体单方面与名人、虚拟角色或聊天机器人产生的密切连接感
2026-01-04 14:25:00
飞晟科技入选海南省儋州市中小企业数字化转型城市试点服务商
近日,海南省儋州市科学技术和工业信息化局对外公示《儋州市中小企业数字化转型城市试点服务商拟纳入名单(第一批)》。公示名单显示
2026-01-04 15:28:00
抖音生活服务联合南京德基广场落地“心动街区”,电视台直播+明星见面会+打卡活动助力商圈消费
12月30日,抖音生活服务“心动街区”活动联合江苏电视台城市频道零距离栏目发起“心动德基24h·南京跨年在德基”美食专场直播
2026-01-04 15:30:00
浪潮卓数大数据旗下公司入围多项2025年山东省大数据产业“三优两重”项目
近日,山东省工业和信息化厅正式公布2025年山东省大数据产业“三优两重”项目名单。浪潮卓数大数据旗下天元征信公司、浪潮(山东)大数据科技有限公司
2026-01-04 15:31:00
华麟数科推出联盟生态链“麒麟链”,加速数字经济深度融合与转型
【中国,2026年1月】 —— 在数字经济浪潮席卷全球、深入渗透各行各业的关键阶段,华麟数科(广东)有限公司(以下简称“华麟数科”)正式宣布
2026-01-04 15:31:00
以具身智能赋能教育未来----开普勒机器人助力高校产学研融合创新
在新一轮科技革命与产业变革加速演进的背景下,人工智能正从"算法与算力"的竞争,走向"智能体与真实世界深度融合"的新阶段
2026-01-04 15:33:00
中国首个!新奈发布“智能呼吸工程体系”,破解家用呼吸设备长期安全难题
在睡眠与呼吸健康领域,真正的改变往往不是某一功能的增加,而是背后那套长期支撑它持续进化的技术体系。2025年12月,新奈 Synaire 对外发布年度科研成果
2026-01-04 15:33:00
中国科技定义未来运动 HURA超现实远程赛车亮相世界未来运动会
2025年12月18日至23日,全球体育科技前沿的目光齐聚阿联酋首都阿布扎比国家展览中心。在这里举办的2025世界未来运动会(Games of the Future 2025)上
2026-01-04 15:33:00
京东健康深化政企协同 助力吉林人参产业发展提质增效
元旦假期期间,人参等滋补品在节庆送礼与家庭健康消费中的需求集中释放。京东健康的消费数据显示,近一个月以来,人参等滋补品类销售同比增长55%
2026-01-04 15:59:00
稳送万物,乘势而上:顺丰同城交出2025年度答卷
2025年,即时零售的“东风”依旧猛烈,市场规模逼近万亿大关,“餐饮+非餐”品类单量均刷新了历史纪录,验证即时零售的天花板远未见顶
2026-01-04 13:55:00