我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

英伟达llama-3.1-minitron4bai模型发布

类别：科技发布时间：2024-08-18 01:38:00 来源：浅语科技

8月17日消息，英伟达公司联合Meta公司发布了最新的Llama-3.1-Minitron4BAI模型，主要通过结构化权重剪枝、知识提炼等尖端技术，成功蒸馏（Distill）出40亿参数的“小而强”模型。

图源：英伟达

Llama-3.1-Minitron4B模型在Llama-3.1-Minitron8B基础上蒸馏而来，英伟达在深度和宽度方向上使用了结构化剪枝技术。

IT之家注：剪枝是一种删除网络中不那么重要的层或神经元的技术，保留其性能的情况下，目的是减小模型的大小和复杂度。

英伟达通过从模型中删除16层来进行深度剪枝，并将其从8B模型缩减为4B模型，此外还部署另一种技术，通过修剪嵌入维度和MLP中间层来进行宽度剪枝。

除了剪枝，Nvidia还采用了经典蒸馏技术来提高Llama-3.1-Minitron4B的效率。

知识蒸馏是一个过程，在这个过程中，一个较小的模型（即学生）会被训练成模仿一个更大、更复杂的模型（即教师）的行为。通过这种方式，较小模型中保留了原始模型的大部分预测能力，但速度更快，资源更节省。

英伟达将此与蒸馏技术和剪枝技术相结合，确保重新训练的4B模型性能优异，并在更大的模型中得到很好的应用。

。

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-08-18 08:45:05

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于英伟,模型,模型,英伟,技术,结构化的资讯：

斯坦福AI虚拟小镇开源；英伟达再推超级芯片；OpenAI发布

...优。此外，Anthropic还称，Claude Instant 1.2能“生成更长、更结构化的回答。与Claude达成合作的企业

2023-08-14 15:59:00

GTC对话黄仁勋：我眼中的GPU，和别人有很大差别

...文中构建你的问题或观点。大型语言模型以不受约束和非结构化的方式运行，这同时也是它的潜力之一。它从文本中学到了很多东西，但可能不适合泛化。它们如何在空间泛化是一种「魔力」，机器

2024-03-22 08:00:00

黄仁勋：英伟达的AI算力，已经“1折”出售

...运行它们；对于企业来说，真正的难题是混合结构的、非结构化的数据，如何被调动。这或许能够带来商业模式的更新。以下为双方对话主要内容，经极客公园整理编辑：01.谈合作：把最好的计

2023-06-28 15:14:00

AI制药加速落地多家巨头抢滩

...特征，既有来自于基因测序的数据、蛋白质或化学化合物结构化的数据，也有来自于生物活性的特定数据等，数据量初步估算为百亿级。而AI缺乏对生物体系机制的认知，对不同尺度、不同层级的

2024-05-09 22:27:00

顶级专家讨论：生成式 AI 与机器人技术的未来

...的潜力和需求，但同时，许多农业任务因其户外执行和非结构化的环境特征，带来了极大的挑战。Matthew（CMU）：农业领域超越了传统的制造业和仓储业，为机器人技术提供了一个广阔

2023-12-29 09:40:00

晶圆级AI芯片WSE-3性能公布：80亿参数模型上每秒生成1

...合和扩散）提供原生支持。Cerebras 仍然是唯一为动态和非结构化稀疏性提供本机硬件加速的平台，相比英伟达的DGX-100计算机系统

2024-09-02 13:36:00

全球首个纯电驱拟人奔跑人形机器人正式发布！

...位精度差的问题，又解决了模型预测控制方法当中对于非结构化环境适应性差的问题，达到更稳健、更拟人、更泛化的效果，可进一步推动规模化商业应用。发布会上，“天工”还为现场观众带

2024-04-27 23:57:00

“大模型”时代路凯智行如何Rock AI

...、控制、决策的综合性模型，其中多模态体现在综合融合结构化信息（如地图、车辆状态等）、类图像信息（图像、点云、其他雷达数据）及文本信息（规范、标准等）构建以数据为驱动，以规范为

2024-04-16 19:33:00

AI数据之战：大模型的“燃料”还能烧多久？

...较低。”在中国科学院院士鄂维南看来，如何将大量的非结构化数据转化为结构化形式，以降低数据分析门槛与成本，成为亟待解决的问题。非结构化数据，是如文本、图片、语音及视频等数据，因

2024-07-09 17:41:00

更多关于科技的资讯：

汇川第二届酱香咖啡生活文化周延续精彩

多彩贵州网讯11月1日，酱咖“遵”有味·“汇”爱这一杯——中国咖啡冲煮大赛西部决赛暨汇川第二届酱香咖啡生活文化周活动第二天

2025-11-03 18:11:00

中拉如何以创新谋合作？听企业这样说——

大河网讯向新向智，共赢未来。11月3日，第十八届中国—拉美企业家高峰会在郑州开幕。以创新合作谋长远，中拉合作将如何开辟出广阔且极具吸引力的“新蓝海”

2025-11-03 18:16:00

香港金融科技周开幕蚂蚁集团井贤栋：以香港为支点，加速全球化

11月3日，2025年香港金融科技周开幕。蚂蚁集团董事长井贤栋在主论坛上表示，香港已成为蚂蚁集团及旗下多家公司的全球化战略支点

2025-11-03 18:46:00

香港大学机械工程学院与沃特海默签署合作协议推动微孔铜箔国产

中新经纬11月3日电 (龚宸芫)中新经纬获悉，香港大学机械工程学院与广州沃特海默新材料科技有限公司(下称沃特海默)近日签署合作协议

2025-11-03 19:11:00

破局香港高价蟹难题京东超级供应链打造“产地-门店”空运直达

今秋，香港“蟹友”有了省心又省钱购蟹的新选择。近日，恰逢京东11.11全球好物节，这也是香港佳宝超市加入京东后首次参与这一年度消费盛事

2025-11-03 20:49:00

2025年培育钻定制品牌榜出炉！6大TOP品牌工艺与口碑深度

在可持续发展理念深入人心的今天，培育钻石行业正迎来前所未有的发展机遇。据《2024-2025全球培育钻石珠宝消费报告》数据显示

2025-11-03 21:26:00

前瞻布局未来产业新奥以智能助力高质量发展

河北新闻网讯（张新）日前，《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》正式发布，将“构建以先进制造业为骨干的现代化产业体系”列为核心任务之一

2025-11-03 18:04:00

中央音乐学院发布音乐脑机接口“央音一号”

中国青年报客户端讯（中青报·中青网记者蒋肖斌）音乐脑机接口“央音一号”，近日在中央音乐学院发布。中央音乐学院音乐人工智能与音乐信息科技系主任李小兵表示

2025-11-03 16:52:00

11.11提前抢！三联家电折扣让利，家电焕新正当时

鲁网11月3日讯随着11.11购物节的脚步日益临近，全国家电消费市场热度持续攀升，山东地区更是提前进入 “焕新倒计时”

2025-11-03 15:52:00

安徽牧羊人可持续时尚工业园项目开工致力打造羊毛针织行业的佼

大皖新闻讯 11月3日，安徽牧羊人可持续时尚工业园项目开工奠基仪式举行。项目建成后，将形成年产1000万件成衣，7200吨纺纱

2025-11-03 16:11:00

东湖评论：破解流量密码，走好城市高质量发展之路

“景德镇鸡排哥”用一碗香辣鸡排撬动全网关注，这座千年瓷都再次被推上流量风口。草根摊主的日常片段在网络掀起打卡热潮，小众街巷因一条短视频迎来客流井喷

2025-11-03 12:25:00

乘AI之势，筑电子产业之基，CPCA Show Plus 2

2025年10月28日-30日，电子半导体产业创新发展大会暨国际电子电路（大湾区）展览会（以下简称：CPCA Show Plus）在深圳国际会展中心(宝安)盛大举办

2025-11-03 12:43:00

培育钻值得购买吗？超全选购攻略一篇搞定，附头部品牌深度测评

当越来越多的年轻人开始琢磨“如何高性价比的结个婚”，培育钻石凭借着价格优势、环保理念，正成为暗潮涌动的钻戒市场的新宠。据统计

2025-11-03 12:45:00

未来，AI有望打造口感逼真的植物蛋白

大河网讯 “人工智能（AI）正以前所未有的速度加速食品创新，它不仅能打造口感逼真的植物蛋白、通过文本生成全新食品配方，还能辅助设计个性化营养食品

2025-11-03 13:10:00

Facebook广告开户公司如何选：从服务到安全，全方位的评

2025 年，Facebook 依托 Meta 生态的 29.8 亿全球月活用户（Statista 数据），仍是企业海外拓客的关键阵地

2025-11-03 12:46:00

头条订阅服务

英伟达llama-3.1-minitron4bai模型发布