权重,模型,语言,开放,模型,数据头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

谷歌推出datagemma开放权重语言模型新版本

...ons中的真实世界统计数据，推出了一种名为DataGemma的开放权重语言模型新版本。这项研究旨在解决大语言模型（LLMs）处理数值或统计数据时面临的幻觉难题，精确性至关重要。DataGemma通过两种关键技术：检索交错生成（RIG）和...……更多

2024-09-13 20:42:00权重,模型,语言,开放,模型,数据

马斯克承诺开源版大模型来了！Grok-1：3140亿参数迄

...40 亿参数的混合专家（MoE）模型‘Grok-1’，以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言模型。封面图根据 Grok 提示使用 Midjourney 生成的：神经网络的 3D 插图，具有透明节点和发光连接，以不...……更多

2024-03-18 11:51:00马斯,马斯克,权重,架构,模型,参数

王坚院士最新发声：人类已进入计算范式时代，AI将成为科学革命

...在今年的一月份讲出口管制时候，第一次说大语言模型的权重也要进行足够管制，大语言模型的权重对我们来讲就是resource，因为今天我们除了传统意义上的代码以外，其实有很多东西对科技创新有帮助，不只是对产业，所以我...……更多

2025-02-21 16:11:00范式,院士,革命,人类,科学,工具

腾讯版Sora发布即开源！130亿参数，模型权重、推理代码全

...亿参数，成为目前参数量最大的开源视频生成模型。模型权重、推理代码、模型算法等全部上传GitHub与Hugging Face，一点没藏着。实际效果如何呢？目前该模型已上线腾讯元宝APP，用户可在AI应用中的“AI视频”板块申请试用。API...……更多

2024-12-04 09:50:00腾讯,权重,推理,模型,参数,代码

权威AI开源标准1.0版发布：Llama也不算开源

...创建；用于构建和运行 AI 的完整代码；训练中的设置和权重，帮助 AI 产生相应的结果。这一定义直接直击 Meta 推动的 Llama 大模型。虽然在生成式 AI 领域里，Llama 一直被广泛宣传为最大的开源 AI 模型，Llama 的使用条款中支持...……更多

2024-10-30 09:52:00权威,标准,数据,模型,系统,训练

中国最大开源MoE模型，255B参数无条件免费商用，元象发布

...计算任务，从而减少通信等待时间。（2）效果方面专家权重：MoE 中的专家总数为 N ，每个 token 会选择 topK 个专家参与后续的计算，由于专家容量的限制，每个 token 实际选择到的专家数为 M，M<=K根据对比实验的效果，我们选...……更多

2024-09-18 13:36:00中国,商用,模型,参数,模型,专家

中国电信开源星辰语义大模型，开放1t清洗数据集

...B版本开源了对话模型TeleChat-7B-bot，以及其huggingface格式的权重文件。此外，还开源了7B模型的int8和int4量化版本。在模型开发上，星辰语义大模型已与华为昇腾AI基础软硬件完成适配：支持Atlas300Ipro推理卡，具备int8量化能力；支...……更多

2024-01-14 09:52:00中国电信,语义,中国,星辰,清洗,模型

开放模型权重被指将导致AI失控，Meta遭举牌抗议

...。与之相反，Meta 的 LLaMA 系列开源模型向公众提供了模型权重，使得任何拥有合适硬件和专业知识的人都可以自行复制和调整模型。一旦发布了模型权重，发布公司就不再有任何手段来控制 AI 的使用方式了。在 Holly Elmore 看来，...……更多

2023-10-08 18:12:00权重,模型,开放,模型,权重,安全

马斯克打脸OpenAI！全球最大模型Grok-1开源

...k-1正式对外开源开放，用户可直接通过磁链下载基本模型权重和网络架构信息。（图/钛媒体）xAI表示，Grok-1是一个由xAI 2023年10月使用基于JAX和Rust的自定义训练堆栈、从头开始训练的3140亿参数的混合专家（MOE）模型，远超OpenAI...……更多

2024-03-20 13:44:00马斯,马斯克,模型,全球,马斯,马斯克

“言出必行”马斯克，全球最大开源模型Grok真的来了

...Grok开源美东时间3月17日，xAI 正式宣布开源大模型Grok-1的权重和网络架构。xAI 表示，开源版大模型Grok-1是一个由 xAI 从头开始训练的 3140 亿个参数混合专家模型。据介绍，基础模型基于大量文本数据进行训练，没有针对任何具体...……更多

2024-03-18 11:50:00马斯,马斯克,模型,全球,马斯,马斯克

碾压所有对手？谷歌发布轻量化开源大模型，笔记本电脑就可跑

...Gemma更加轻量化。同时，Gemma依旧保持免费使用，其模型权重也一并开源，并且允许商用。谷歌共发布了两种不同权重规模的模型，分别为Gemma 2B（20亿参数）和Gemma 7B（70亿参数）。每种规模都有预训练和指令微调版本，允许所有...……更多

2024-02-22 12:44:00模型,对手,笔记本,笔记,电脑,模型

苹果的封闭生态为大模型打开！发布开源多模态大模型、每天为 A

...态大模型也没有收到太多关注。当时，该版本包含代码和权重，但仅供研究使用，而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Android，关于本地大模型为小型设备提供支持的讨论越来越多。...……更多

2023-12-26 14:06:00模型,生态,模态,零碎,苹果,模型

万字技术干货！LLM工程师必读量化指南，可视化图解揭秘大模型

...模型参数量上，规模通常达到数十亿的级别（其中主要是权重）。这些参数不仅存储成本相当高，推理阶段的计算量也很大。在推理过程中，激活值是输入和权重的乘积，因此权重数量越多，激活值也会越大。因此，我们希望...……更多

2024-08-01 09:38:00干货,可视化,模型,工程师,指南,工程

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上

...。具体来说，为了支持图像输入，Meta 训练了一组适应器权重（adapter weight），其可将预训练的图像编码器集成到预训练的语言模型中。该适应器由一系列交叉注意层组成，这些层的作用是将图像编码器表征馈送给语言模型。为...……更多

2024-09-27 13:42:00推理,可在,图像,运行,版本,支持

苹果AI震撼上线iPhone，进化版Siri却没有ChatG

...在后训练阶段，苹果对模型进行了压缩和量化，平均每个权重低于4位。量化后的模型通常会有一定程度的质量损失。因此，研发团队并不是直接将量化模型交给应用团队进行功能开发，而是附加了一组参数高效的LoRA适配器来恢...……更多

2024-08-01 09:40:00进化,模型,苹果,报告,技术,苹果

360智脑7b参数模型采用3.4万亿tokens训练

...中文大海捞针测试，同样做到了98%以上的准确率。除模型权重外，该模型的微调训练代码，推理代码等全套工具集也被一并开源，大模型相关开发者可做到“开箱即用”。据IT之家此前报道，周鸿祎曾表示，前段时间大模型行业...……更多

2024-04-14 01:04:00模型,训练,参数,模型,文本,评测

模拟5亿年自然进化史，全新蛋白质大模型ESM3诞生！前Met

...m但比较遗憾的是，目前在HuggingFace仓库中还没有公开模型权重。英伟达官方博客显示，ESM3将在Nvidia BieNeMo平台提供一个小型开源版本的代码和权重，但仅限于非商业用途。仓库地址：https://huggingface.co/EvolutionaryScale/esm3-s……更多

2024-06-27 09:31:00进化史,力作,老将,蛋白质,进化,蛋白

「学术版ChatGPT」登场！Ai2打造科研效率神器Open

...文献搜索和文献综述工作，而且做到了数据、代码、模型权重的全方位开源。LLM集成到搜索引擎中，可以说是当下AI产品的一个热门落地方向。前有Perplexity横空出世，后有谷歌Gemini和OpenAI的SearchGPT纷纷加入。就在11月23日，有人...……更多

2024-11-27 13:33:00神器,文献,效率,科研,学术,模型

一文看尽Meta开源大礼包！全面覆盖图像分割、语音、文本、表

...的影响。本次Meta更新了Meta Segment Anything Model 2.1 (SAM 2.1)权重，性能更强。开源链接：https://github.com/facebookresearch/sam2相比SAM2，研究人员引入了额外的数据增强技术来模拟视觉相似物体和小物体，并……更多

2024-11-28 12:02:00一文,大礼包,大礼,安全性,语音,图像