• 我的订阅
  • 科技

英伟达llama-3.1-minitron4bai模型发布

类别:科技 发布时间:2024-08-18 01:38:00 来源:浅语科技

8月17日消息,英伟达公司联合Meta公司发布了最新的Llama-3.1-Minitron4BAI模型,主要通过结构化权重剪枝、知识提炼等尖端技术,成功蒸馏(Distill)出40亿参数的“小而强”模型。

英伟达llama-3.1-minitron4bai模型发布

图源:英伟达

Llama-3.1-Minitron4B模型在Llama-3.1-Minitron8B基础上蒸馏而来,英伟达在深度和宽度方向上使用了结构化剪枝技术。

IT之家注:剪枝是一种删除网络中不那么重要的层或神经元的技术,保留其性能的情况下,目的是减小模型的大小和复杂度。

英伟达通过从模型中删除16层来进行深度剪枝,并将其从8B模型缩减为4B模型,此外还部署另一种技术,通过修剪嵌入维度和MLP中间层来进行宽度剪枝。

除了剪枝,Nvidia还采用了经典蒸馏技术来提高Llama-3.1-Minitron4B的效率。

知识蒸馏是一个过程,在这个过程中,一个较小的模型(即学生)会被训练成模仿一个更大、更复杂的模型(即教师)的行为。通过这种方式,较小模型中保留了原始模型的大部分预测能力,但速度更快,资源更节省。

英伟达llama-3.1-minitron4bai模型发布

英伟达将此与蒸馏技术和剪枝技术相结合,确保重新训练的4B模型性能优异,并在更大的模型中得到很好的应用。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-18 08:45:05

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

斯坦福AI虚拟小镇开源;英伟达再推超级芯片;OpenAI发布爬虫机器人 | 本周硅谷发生了什么?
...优。此外,Anthropic还称,Claude Instant 1.2能“生成更长、更结构化的回答。与Claude达成合作的企业
2023-08-14 15:59:00
GTC对话黄仁勋:我眼中的GPU,和别人有很大差别
...文中构建你的问题或观点。大型语言模型以不受约束和非结构化的方式运行,这同时也是它的潜力之一。它从文本中学到了很多东西,但可能不适合泛化。它们如何在空间泛化是一种「魔力」,机器
2024-03-22 08:00:00
黄仁勋:英伟达的AI算力,已经“1折”出售
...运行它们;对于企业来说,真正的难题是混合结构的、非结构化的数据,如何被调动。这或许能够带来商业模式的更新。以下为双方对话主要内容,经极客公园整理编辑:01.谈合作:把最好的计
2023-06-28 15:14:00
AI制药加速落地 多家巨头抢滩
...特征,既有来自于基因测序的数据、蛋白质或化学化合物结构化的数据,也有来自于生物活性的特定数据等,数据量初步估算为百亿级。而AI缺乏对生物体系机制的认知,对不同尺度、不同层级的
2024-05-09 22:27:00
顶级专家讨论:生成式 AI 与机器人技术的未来
...的潜力和需求,但同时,许多农业任务因其户外执行和非结构化的环境特征,带来了极大的挑战。Matthew(CMU):农业领域超越了传统的制造业和仓储业,为机器人技术提供了一个广阔
2023-12-29 09:40:00
晶圆级AI芯片WSE-3性能公布:80亿参数模型上每秒生成1800个Token
...合和扩散)提供原生支持。Cerebras 仍然是唯一为动态和非结构化稀疏性提供本机硬件加速的平台,相比英伟达的DGX-100计算机系统
2024-09-02 13:36:00
全球首个纯电驱拟人奔跑人形机器人正式发布!
...位精度差的问题,又解决了模型预测控制方法当中对于非结构化环境适应性差的问题,达到更稳健、更拟人、更泛化的效果,可进一步推动规模化商业应用。 发布会上,“天工”还为现场观众带
2024-04-27 23:57:00
“大模型”时代 路凯智行如何Rock AI
...、控制、决策的综合性模型,其中多模态体现在综合融合结构化信息(如地图、车辆状态等)、类图像信息(图像、点云、其他雷达数据)及文本信息(规范、标准等)构建以数据为驱动,以规范为
2024-04-16 19:33:00
AI数据之战:大模型的“燃料”还能烧多久?
...较低。”在中国科学院院士鄂维南看来,如何将大量的非结构化数据转化为结构化形式,以降低数据分析门槛与成本,成为亟待解决的问题。非结构化数据,是如文本、图片、语音及视频等数据,因
2024-07-09 17:41:00
更多关于科技的资讯:
汇川第二届酱香咖啡生活文化周延续精彩
多彩贵州网讯11月1日,酱咖“遵”有味·“汇”爱这一杯——中国咖啡冲煮大赛西部决赛暨汇川第二届酱香咖啡生活文化周活动第二天
2025-11-03 18:11:00
中拉如何以创新谋合作?听企业这样说——
大河网讯 向新向智,共赢未来。11月3日,第十八届中国—拉美企业家高峰会在郑州开幕。以创新合作谋长远,中拉合作将如何开辟出广阔且极具吸引力的“新蓝海”
2025-11-03 18:16:00
香港金融科技周开幕 蚂蚁集团井贤栋:以香港为支点,加速全球化发展
11月3日,2025年香港金融科技周开幕。蚂蚁集团董事长井贤栋在主论坛上表示,香港已成为蚂蚁集团及旗下多家公司的全球化战略支点
2025-11-03 18:46:00
中新经纬11月3日电 (龚宸芫)中新经纬获悉,香港大学机械工程学院与广州沃特海默新材料科技有限公司(下称沃特海默)近日签署合作协议
2025-11-03 19:11:00
破局香港高价蟹难题 京东超级供应链打造“产地-门店”空运直达新模式
今秋,香港“蟹友”有了省心又省钱购蟹的新选择。近日,恰逢京东11.11全球好物节,这也是香港佳宝超市加入京东后首次参与这一年度消费盛事
2025-11-03 20:49:00
2025年培育钻定制品牌榜出炉!6大TOP品牌工艺与口碑深度全解析
在可持续发展理念深入人心的今天,培育钻石行业正迎来前所未有的发展机遇。据《2024-2025全球培育钻石珠宝消费报告》数据显示
2025-11-03 21:26:00
前瞻布局未来产业 新奥以智能助力高质量发展
河北新闻网讯(张新)日前,《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》正式发布,将“构建以先进制造业为骨干的现代化产业体系”列为核心任务之一
2025-11-03 18:04:00
中央音乐学院发布音乐脑机接口“央音一号”
中国青年报客户端讯(中青报·中青网记者 蒋肖斌)音乐脑机接口“央音一号”,近日在中央音乐学院发布。中央音乐学院音乐人工智能与音乐信息科技系主任李小兵表示
2025-11-03 16:52:00
11.11提前抢!三联家电折扣让利,家电焕新正当时
鲁网11月3日讯随着11.11购物节的脚步日益临近,全国家电消费市场热度持续攀升,山东地区更是提前进入 “焕新倒计时”
2025-11-03 15:52:00
安徽牧羊人可持续时尚工业园项目开工 致力打造羊毛针织行业的佼佼者
大皖新闻讯 11月3日,安徽牧羊人可持续时尚工业园项目开工奠基仪式举行。项目建成后,将形成年产1000万件成衣,7200吨纺纱
2025-11-03 16:11:00
“景德镇鸡排哥”用一碗香辣鸡排撬动全网关注,这座千年瓷都再次被推上流量风口。草根摊主的日常片段在网络掀起打卡热潮,小众街巷因一条短视频迎来客流井喷
2025-11-03 12:25:00
乘AI之势,筑电子产业之基,CPCA Show Plus 2025 圆满闭幕,2026再相见!
2025年10月28日-30日,电子半导体产业创新发展大会暨国际电子电路(大湾区)展览会(以下简称:CPCA Show Plus)在深圳国际会展中心(宝安)盛大举办
2025-11-03 12:43:00
培育钻值得购买吗?超全选购攻略一篇搞定,附头部品牌深度测评
当越来越多的年轻人开始琢磨“如何高性价比的结个婚”,培育钻石凭借着价格优势、环保理念,正成为暗潮涌动的钻戒市场的新宠。据统计
2025-11-03 12:45:00
未来,AI有望打造口感逼真的植物蛋白
大河网讯 “人工智能(AI)正以前所未有的速度加速食品创新,它不仅能打造口感逼真的植物蛋白、通过文本生成全新食品配方,还能辅助设计个性化营养食品
2025-11-03 13:10:00
2025 年,Facebook 依托 Meta 生态的 29.8 亿全球月活用户(Statista 数据),仍是企业海外拓客的关键阵地
2025-11-03 12:46:00