权重,模型,开放,模型,权重,安全头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...。与之相反，Meta 的 LLaMA 系列开源模型向公众提供了模型权重，使得任何拥有合适硬件和专业知识的人都可以自行复制和调整模型。一旦发布了模型权重，发布公司就不再有任何手段来控制 AI 的使用方式了。在 Holly Elmore 看来，...……更多

2023-10-08 18:12:00权重,模型,开放,模型,权重,安全

谷歌推出datagemma开放权重语言模型新版本

...ons中的真实世界统计数据，推出了一种名为DataGemma的开放权重语言模型新版本。这项研究旨在解决大语言模型（LLMs）处理数值或统计数据时面临的幻觉难题，精确性至关重要。DataGemma通过两种关键技术：检索交错生成（RIG）和...……更多

2024-09-13 20:42:00权重,模型,语言,开放,模型,数据

马斯克承诺开源版大模型来了！Grok-1：3140亿参数迄

...40 亿参数的混合专家（MoE）模型‘Grok-1’，以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言模型。封面图根据 Grok 提示使用 Midjourney 生成的：神经网络的 3D 插图，具有透明节点和发光连接，以不...……更多

2024-03-18 11:51:00马斯,马斯克,权重,架构,模型,参数

中国最大开源MoE模型，255B参数无条件免费商用，元象发布

...计算任务，从而减少通信等待时间。（2）效果方面专家权重：MoE 中的专家总数为 N ，每个 token 会选择 topK 个专家参与后续的计算，由于专家容量的限制，每个 token 实际选择到的专家数为 M，M<=K根据对比实验的效果，我们选...……更多

2024-09-18 13:36:00中国,商用,模型,参数,模型,专家

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mist

...，这是迄今为止性能最好的「真正开源」的模型，不仅有权重和训练代码，而且是基于开放数据集DCLM-Baseline。相比模型性能，DCLM做出的「真正开源」的典范更加引人关注。对比大部分科技巨头只搞闭源模型，或「犹抱琵琶半遮...……更多

2024-07-22 09:41:00血战,强势,模型,苹果,模型,数据

万字技术干货！LLM工程师必读量化指南，可视化图解揭秘大模型

...模型参数量上，规模通常达到数十亿的级别（其中主要是权重）。这些参数不仅存储成本相当高，推理阶段的计算量也很大。在推理过程中，激活值是输入和权重的乘积，因此权重数量越多，激活值也会越大。因此，我们希望...……更多

2024-08-01 09:38:00干货,可视化,模型,工程师,指南,工程

70倍极致压缩！大模型的检查点再多也不怕

...信息的稀疏性实现更高的剪枝比例；另一个是将优化器和权重联合起来进行压缩，实现整体的高压缩率。具体方法1. 检查点残差在训练过程中，当前的参数可以看作上一个检查点存储的权重加上逐次迭代时梯度更新的总和，这...……更多

2024-08-06 09:27:00检查点,极致,模型,检查,检查点,权重

AI监管和开放，到底如何平衡？

...的专家们发表了一篇论文，他们通过实验研究了持续模型权重的扩散是否会帮助恶意者利用更强大的未来模型来造成大规模伤害，结果发现，开源大模型的确可能存在风险。研究人员安排了一场黑客马拉松，17名参与者扮演生物...……更多

2023-11-04 13:54:00监管,开放,监管,源派,模型,风险

GPU训Llama 3.1疯狂崩溃，竟有大厂用CPU服务器跑

...token过程中，由于模型首次加载，会在内存中存放全部的权重参数，以及KV Cache等数据。这是模型参数本身所占内存空间的2-3倍。对于千亿参数模型来说，大量的参数和数据输入，需要在强大计算单元中处理。对此，它需要支持...……更多

2024-08-02 09:47:00大厂,模型,参数,疯狂,服务器,服务

科学家研发自动驾驶新模块，让自动驾驶场景理解更接近人类认知

...驶员注意区域，他们将其作为一个掩码来调整原始图像的权重，从而使自动驾驶车辆能够像经验丰富的人类驾驶员一样，具备有效定位和预测潜在风险因素的能力。预测驾驶员视觉注视区域的引入，不仅为下游决策任务提供更具...……更多

2024-04-11 10:53:00驾驶,认知,科学家,模块,场景,人类

“言出必行”马斯克，全球最大开源模型Grok真的来了

...Grok开源美东时间3月17日，xAI 正式宣布开源大模型Grok-1的权重和网络架构。xAI 表示，开源版大模型Grok-1是一个由 xAI 从头开始训练的 3140 亿个参数混合专家模型。据介绍，基础模型基于大量文本数据进行训练，没有针对任何具体...……更多

2024-03-18 11:50:00马斯,马斯克,模型,全球,马斯,马斯克

碾压所有对手？谷歌发布轻量化开源大模型，笔记本电脑就可跑

...Gemma更加轻量化。同时，Gemma依旧保持免费使用，其模型权重也一并开源，并且允许商用。谷歌共发布了两种不同权重规模的模型，分别为Gemma 2B（20亿参数）和Gemma 7B（70亿参数）。每种规模都有预训练和指令微调版本，允许所有...……更多

2024-02-22 12:44:00模型,对手,笔记本,笔记,电脑,模型

马斯克要求OpenAI恢复开源，背后是开源闭源路线之争

...最重要的部分，例如用于训练其大语言模型和预训练模型权重的完整数据集。这或多或少类似于Meta开源LLaMA的方式。”AI巨头的决裂2月29日，马斯克在旧金山法院对OpenAI及公司CEO阿尔特曼和总裁布罗克曼提起诉讼，震惊全球科技...……更多

2024-03-09 22:51:00马斯,马斯克,路线,背后,马斯,马斯克

基于DolphinDB的高性能Barra风控模型

...接口函数为getPredicOut，实现脚本请联系小助手。组合权重优化组合权重优化的目的在于将组合的风险特征完全定量化，使得投资经理可以清楚地了解组合的收益来源和风险暴露。权重优化的目标函数，优化目标多种多样，例...……更多

2024-02-27 15:30:00高性能,模型,因子,模型,收益,风险

3秒让AI生成风险减少30%！复旦新研究拿下扩散模型概念移除

...ECE借鉴了已有的方法UCE，通过解析解来编辑交叉注意力的权重，一步到位，避免繁琐微调。给定“源”概念（例如，“裸露”），“目标”概念（例如，空文本“ ”），以及交叉注意力的K/V投影矩阵，UCE的目标是找到新权重，...……更多

2024-08-26 09:54:00复旦,生成,模型,概念,风险,研究

苹果AI震撼上线iPhone，进化版Siri却没有ChatG

...在后训练阶段，苹果对模型进行了压缩和量化，平均每个权重低于4位。量化后的模型通常会有一定程度的质量损失。因此，研发团队并不是直接将量化模型交给应用团队进行功能开发，而是附加了一组参数高效的LoRA适配器来恢...……更多

2024-08-01 09:40:00进化,模型,苹果,报告,技术,苹果

马斯克打脸OpenAI！全球最大模型Grok-1开源

...k-1正式对外开源开放，用户可直接通过磁链下载基本模型权重和网络架构信息。（图/钛媒体）xAI表示，Grok-1是一个由xAI 2023年10月使用基于JAX和Rust的自定义训练堆栈、从头开始训练的3140亿参数的混合专家（MOE）模型，远超OpenAI...……更多

2024-03-20 13:44:00马斯,马斯克,模型,全球,马斯,马斯克

谷歌开源最强端侧小模型：2B参数越级跑赢GPT-3.5-Tu

...用户可以从 Kaggle、Hugging Face、Vertex AI Model Garden 下载模型权重。用户还可以在 Google AI Studio 中试用其功能。下载权重地址：https://huggingface.co/collections/google/gemma-2-2b-……更多

2024-08-02 09:43:00模型,参数,模型,性能,安全,研究

精准狙击Llama 3.1？Mistral AI开源Larg

...是开放的，但只限于研究和非商业用途。它提供了开放的权重，允许第三方根据自己的需求对模型进行微调。这一协议是对用户使用条件的一个重要限制。对于需要自行部署 Mistral Large 2 的商业用途，必须提前获取 Mistral AI 商业...……更多

2024-07-26 09:36:00模型,基准,多语,测试,性能,生成

Llama3.1根本卖不动！业内人士：开源模型成本反而更高

...型要复杂很多，它可以开源的包括模型训练源代码、参数权重、训练数据等。但目前模型厂商通常仅仅开源参数权重，而训练源代码、训练数据等均未开源，这就导致开发者无法去改进它，也就无法对开源模型的效果做贡献。比...……更多

2024-08-28 09:44:00业内人士,模型,业内,根本,人士,成本

MSRA：视觉生成六大技术问题

...分析结果。其次，按照常规配置，对四种损失赋予相同的权重。基于这些假设，可以按以下方式简化重构损失的计算：因此，最小化图像级重构损失的潜在空间表示将是：这不能保证x0+x1+x2+x3比x0+x1+x2更接近arg min X。假设不同深...……更多

2024-07-15 09:34:00生成,视觉,问题,技术,模型,图像

秒变3D模型，AI游戏或被颠覆，AI人工智能ETF(5129

...，截至2024年8月30日，中证人工智能主题指数(930713)前十大权重股分别为海康威视(002415)、中际旭创(300308)、韦尔股份(603501)、新易盛(300502)、科大讯飞(002230)、中科曙光(603019)、寒武纪(688256)、澜起科技(688008)、紫光股份……更多

2024-09-09 14:36:00净流入,人工智能,颠覆,人工,模型,资金

中国电信开源星辰语义大模型，开放1t清洗数据集

...B版本开源了对话模型TeleChat-7B-bot，以及其huggingface格式的权重文件。此外，还开源了7B模型的int8和int4量化版本。在模型开发上，星辰语义大模型已与华为昇腾AI基础软硬件完成适配：支持Atlas300Ipro推理卡，具备int8量化能力；支...……更多

2024-01-14 09:52:00中国电信,语义,中国,星辰,清洗,模型

苹果AI版iOS首日火爆：聊天秒变高情商，大模型成最强嘴替

...是在此基础之上蒸馏得到。继续训练时，低质量数据的权重会被降低，并使用数学、代码以及获得授权的高质量数据，对模型能力进行提升。该过程使用了1T tokens的数据，窗口长度也从4096变成了8192。到了下一阶段，窗口长度...……更多

2024-07-31 09:39:00情商,火爆,模型,苹果,模型,苹果

手机跑大模型提速4-5倍！微软亚研院开源新技术，有CPU就行

...要进行混合精度的矩阵乘法运算（mpGEMM），即用低精度的权重和高精度的激活向量进行计算。然而，现有的系统和硬件并不原生支持这种混合精度的矩阵乘法，因此它们通常需要将低精度的权重转换回高精度，这个过程叫做反量...……更多

2024-08-10 09:52:00新技,微软,提速,新技术,模型,手机

“国家队”AI大模型正式发布，AI人工智能ETF(51293

...2024年4月30日，中证沪港深线上消费主题指数(931481)前十大权重股分别为美团-W(03690)、腾讯控股(00700)、快手-W(01024)、顺丰控股(002352)、科大讯飞(002230)、昆仑万维(300418)、京东健康(06618)、世纪华通(002602)、圆通速递(6……更多

2024-05-27 11:50:00人工智能,国家队,布局,人工,模型,资金

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

...个全新的模型架构。在图像输入方面，训练了一组适配器权重，将预训练的图像编码器集成到预训练的大语言模型中。具体来说，该适配器：由一系列交叉注意力层组成，负责将图像编码器的表示输入进大语言模型通过在文本-...……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

「世界开源新王」跌落神坛？重测跑分暴跌实锤造假，2人团队光速

...过一个月的漫长等待，团队终于放出了Reflection 70B的模型权重、训练数据、训练脚本和评估代码。模型权重： https://huggingface.co/glaiveai/Reflection-Llama-3.1-70B训练数据： https://huggingface……更多

2024-10-08 09:47:00神坛,光速,团队,世界,模型,基准

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上

...。具体来说，为了支持图像输入，Meta 训练了一组适应器权重（adapter weight），其可将预训练的图像编码器集成到预训练的语言模型中。该适应器由一系列交叉注意层组成，这些层的作用是将图像编码器表征馈送给语言模型。为...……更多

2024-09-27 13:42:00推理,可在,图像,运行,版本,支持

pytorchtorchao正式发布,提供了一系列优化工具集

...高效训练。在推理方面，torchao提供多种量化方法，包括权重量化（Weight-OnlyQuantization）和动态激活量化（DynamicActivationQuantization），用户可以自有选择适合的量化策略，以获得最佳的模型推理性能。在稀疏性优化方面，torchao可以...……更多

2024-10-03 02:58:00工具集,工具,模型,可将,训练,推理

page 1/3000 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

鼓浪屿世遗文创作品征集活动启动

厦门网讯（厦门日报记者朱道衡）近日，2025鼓浪屿世遗文创作品征集活动启动。此次活动面向全国（含港澳台地区）高校、企业

2025-10-03 08:37:00

医生支招：“充电宝”式休息法助您假期恢复活力

厦门网讯（厦门日报记者楚燕通讯员石青青）长假期间，许多人从忙碌的工作中解脱出来，趁机好好休息。可是，如果休息方式不得当

2025-10-03 08:37:00

清华天津电子院校地协同育“创新雨林” 10载“津”耕从0到

渤海之潮涌动着澎湃的脉搏，海河之畔镌刻着科技的印记。10年前，一颗带有“清华”基因的种子在天津这片沃土扎根；10年后，它长成一棵枝繁叶茂的参天大树

2025-10-03 09:25:00