• 我的订阅
  • 科技

pytorchtorchao正式发布,提供了一系列优化工具集

类别:科技 发布时间:2024-10-03 02:58:00 来源:浅语科技

10月2日消息,据PyTorch新闻稿,PyTorch旗下架构优化库torchao现已正式发布,该优化库主要专注于模型的量化和稀疏性优化,能够在保证性能的同时降低模型的计算成本和RAM用量,从而提升模型运行效率,IT之家附GitHub页面地址(点此访问)。

据介绍,torchao提供了一系列优化工具集,可以帮助LLaMA3等流行的AI模型提升性能,其支持float8、int4等低精度数据类型,能够有效减少硬件开销和RAM用量。

pytorchtorchao正式发布,提供了一系列优化工具集

官方举例,在LLaMA370B模型的预训练中,torchao提供的float8训练流程可将模型计算速度提升1.5倍。开发者只需利用convert_to_float8_training函数,即可将模型训练转换为float8,从而轻松实现模型高效训练。

在推理方面,torchao提供多种量化方法,包括权重量化(Weight-OnlyQuantization)和动态激活量化(DynamicActivationQuantization),用户可以自有选择适合的量化策略,以获得最佳的模型推理性能。

在稀疏性优化方面,torchao可以优化模型参数计算效率,据称可让ViT-H模型的推理速度提升5%。同时,torchao还可以将权重量化为int4,并将键值缓存量化为int8,可令LLaMA3.18B在完整的128K上下文长度下仅占用18.9GB的显存。

pytorchtorchao正式发布,提供了一系列优化工具集

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-10-03 08:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

360智脑7b参数模型采用3.4万亿tokens训练
...除模型权重外,该模型的微调训练代码,推理代码等全套工具集也被一并开源,大模型相关开发者可做到“开箱即用”。据IT之家此前报道,周鸿祎曾表示,前段时间大模型行业卷文本长度,10
2024-04-14 01:04:00
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...的应用程序。支持30秒无代码生成AI Bot,并且集成了插件工具集,满足用户的个性化需求。另外,Coze也对大众开放了GPT商店
2024-02-05 11:37:00
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...供高性能全场景推理算力,产品预置了完备的大模型推理工具集,可大幅提高部署运维大模型推理应用的便利性,通过重构算子等一系列深度优化,极大提升推理算力效率,释放极致推理算力性能。
2024-04-11 10:30:00
...心一言”的核心技术,大模型插件为大家提供了插件开发工具集,可以进行信息服务类、工具类以及基于大语言模型创新类的插件开发。通过平台接入之后,可以和应用层生态进行紧密结合。吴甜还
2023-08-21 07:34:00
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...虹科技(688039)1月5日互动平台表示,公司拥有自研的AIGC工具集,发布了以静态照片生成三维体积视频的方案,并且通过点云模型转换及压缩算法实现高达800倍的视觉无损压缩
2024-02-19 08:10:00
...上下文记忆、知识/库表索引、Prompt工程、Agent执行、通用工具集等扩充大模型的存储记忆、适配应用和调度执行能力,再结合财税、人力、供应链、研发等领域的知识和最佳实践扩
2023-07-28 20:52:00
谈大模型免费和被美双重制裁,周鸿祎“诉苦\
...模型内置进“AI助手”;第二,360AI办公一站式学习办公工具集发布。对于入口级的“AI助手”产品,这里的15家大模型厂商包括智谱AI、商汤科技、百川智能、火山引擎、百度智能
2024-08-05 14:20:00
aiforscience:用人工智能催化一场新的“科学革命”
...科研问题。”向辉说。一路发展至今,百度飞桨AIforScience工具集已能支持AI方法与基础学科方法交叉融合,最大的特点在于能突破基础学科中“基于数值计算求解控制方程”面临
2023-01-01 14:42:00
浪潮海岳软件重磅升级,“软件+AI”助力全场景数字化
...提供数据管理、模型训练、评估优化、插件扩展等一系列工具集,拥有语言理解、逻辑推理、代码生成、内容创作等能力,具备多模型接入、多任务编排、低门槛使用、知识库管理、全场景覆盖、安
2023-09-08 17:05:00
更多关于科技的资讯:
中新经纬2月11日电 据国家市场监督管理总局网站消息,2月4日,国务院反垄断反不正当竞争委员会印发施行《关于公用事业领域的反垄断指南》(以下简称《指南》)
2026-02-11 20:18:00
季季有主题,周周有优惠!2026年河北省电影惠民观影促消费活动启动
河北日报客户端讯(记者肖煜)为积极响应落实国家电影局全国电影惠民消费季安排,进一步激活河北电影市场消费潜力,丰富群众文化生活
2026-02-11 22:05:00
2025国际宠物博览会落幕:Benarmi倡导全生命周期健康管理
12月20日,2025国际宠物博览会在北京市平谷区博物馆、体育中心拉开帷幕,汇聚全球名宠、产业企业与创新项目,集中展现宠物经济的前沿动态与发展趋势
2026-02-11 20:08:00
“民生科幻”领军人吴楚新作《背叛文明》出版,聚焦星际外交博弈
如果高等文明的馈赠是一颗带毒的蜜糖,那人类是否有智慧拒绝唾手可得的诱惑?当思想需要向未来跨出一大步时,阅读科幻依然是当下最高效的途径
2026-02-11 17:22:00
随着云计算、大数据、人工智能等数智技术的迅猛发展,传统劳动形态正经历着前所未有的变革。工作场所的虚拟化、劳动时间的弹性化以及用工关系的多元化
2026-02-11 17:31:00
厦门城市可信数据空间开放试运行推出“马上有数”进驻激励计划 首发5个月资源免费共享东南网2月11日讯 (海峡导报记者 康泽辉) 近日
2026-02-11 17:50:00
元梦空间荣膺两项大奖 闪耀2025人工智能未来设计大赛
2025年11月10日,由工业和信息化部工业文化发展中心主办的2025“人工智能未来设计大赛”全国总决赛在山西太原圆满落幕
2026-02-11 17:50:00
【寒假摘镜总动员】选择哪种近视手术方式?——济南普瑞眼科王晓雪主任为您专业解析
视力是体检中至关重要的一环。选择一种既安全稳定、又符合体检标准的近视手术方式,是实现梦想的关键一步。济南普瑞眼科作为山东省首批蔡司全飞秒4
2026-02-11 17:51:00
潮新闻讯 随着人工智能兴起,数据要素领域的生产性服务业,规模正迅速壮大。近日,浙江省委副书记、省长刘捷在杭州专题调研服务业发展工作
2026-02-11 17:58:00
俊小白与上海吴淞材料实验室联合成立实验室
中国消费者报北京讯(记者孙蔚)近日,上海吴淞材料实验室与国货科创口腔护理品牌俊小白联合成立的个人护理功能介孔材料联合实验室正式落成
2026-02-11 18:06:00
大皖新闻讯 大皖新闻记者从国先中心(合肥)了解到,日前,零次方机器人率先完成中国信通院“可信AI”具身智能基准测试(EAI Bench)
2026-02-11 18:18:00
2月5日,中国消费者协会公布了2025年全国消协组织受理投诉情况统计数据,去年全国消协组织共受理消费者投诉2016448件
2026-02-11 18:06:00
职场人年货买什么?食品类、数码类需求上升
日前,智联招聘发布《职场人春节生存图鉴调研报告》,呈现职场人在春节前后的工作状态、社交压力、休闲计划等。春节前后通常是离职高峰期
2026-02-11 19:14:00
2025年,安徽太和县烟草专卖局(营销部)紧扣行业高质量发展要求,以“强基固本、提质增效”为主线,深化终端现代化转型,在数字化赋能
2026-02-11 14:18:00
从技术到情感,2026值得入手的定制珠宝品牌,一文读懂不踩坑
一、定制珠宝为何成为新消费时代的“刚需”?过去几年,全球珠宝产业正经历一场由内而外的结构性重塑。根据《2026全球珠宝行业白皮书》披露的数据
2026-02-11 14:20:00