• 我的订阅
  • 头条热搜
谷歌推出datagemma开放权重语言模型新版本
...ons中的真实世界统计数据,推出了一种名为DataGemma的开放权重语言模型新版本。这项研究旨在解决大语言模型(LLMs)处理数值或统计数据时面临的幻觉难题,精确性至关重要。DataGemma通过两种关键技术:检索交错生成(RIG)和...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...40 亿参数的混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言模型。封面图根据 Grok 提示使用 Midjourney 生成的:神经网络的 3D 插图,具有透明节点和发光连接,以不...……更多
腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放
...亿参数,成为目前参数量最大的开源视频生成模型。模型权重、推理代码、模型算法等全部上传GitHub与Hugging Face,一点没藏着。实际效果如何呢?目前该模型已上线腾讯元宝APP,用户可在AI应用中的“AI视频”板块申请试用。API...……更多
权威AI开源标准1.0版发布:Llama也不算开源
...创建; 用于构建和运行 AI 的完整代码; 训练中的设置和权重,帮助 AI 产生相应的结果。这一定义直接直击 Meta 推动的 Llama 大模型。虽然在生成式 AI 领域里,Llama 一直被广泛宣传为最大的开源 AI 模型,Llama 的使用条款中支持...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
...计算任务,从而减少通信等待时间。(2)效果方面专家权重:MoE 中的专家总数为 N ,每个 token 会选择 topK 个专家参与后续的计算,由于专家容量的限制,每个 token 实际选择到的专家数为 M,M<=K根据对比实验的效果,我们选...……更多
...B版本开源了对话模型TeleChat-7B-bot,以及其huggingface格式的权重文件。此外,还开源了7B模型的int8和int4量化版本。在模型开发上,星辰语义大模型已与华为昇腾AI基础软硬件完成适配:支持Atlas300Ipro推理卡,具备int8量化能力;支...……更多
开放模型权重被指将导致AI失控,Meta遭举牌抗议
...。与之相反,Meta 的 LLaMA 系列开源模型向公众提供了模型权重,使得任何拥有合适硬件和专业知识的人都可以自行复制和调整模型。一旦发布了模型权重,发布公司就不再有任何手段来控制 AI 的使用方式了。在 Holly Elmore 看来,...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...k-1正式对外开源开放,用户可直接通过磁链下载基本模型权重和网络架构信息。(图/钛媒体)xAI表示,Grok-1是一个由xAI 2023年10月使用基于JAX和Rust的自定义训练堆栈、从头开始训练的3140亿参数的混合专家(MOE)模型,远超OpenAI...……更多
“言出必行”马斯克,全球最大开源模型Grok真的来了
...Grok开源美东时间3月17日,xAI 正式宣布开源大模型Grok-1的权重和网络架构。xAI 表示,开源版大模型Grok-1是一个由 xAI 从头开始训练的 3140 亿个参数混合专家模型。据介绍,基础模型基于大量文本数据进行训练,没有针对任何具体...……更多
碾压所有对手?谷歌发布轻量化开源大模型,笔记本电脑就可跑
...Gemma更加轻量化。同时,Gemma依旧保持免费使用,其模型权重也一并开源,并且允许商用。谷歌共发布了两种不同权重规模的模型,分别为Gemma 2B(20亿参数)和Gemma 7B(70亿参数)。每种规模都有预训练和指令微调版本,允许所有...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Android,关于本地大模型为小型设备提供支持的讨论越来越多。...……更多
万字技术干货!LLM工程师必读量化指南,可视化图解揭秘大模型如何压缩
...模型参数量上,规模通常达到数十亿的级别(其中主要是权重)。 这些参数不仅存储成本相当高,推理阶段的计算量也很大。在推理过程中,激活值是输入和权重的乘积,因此权重数量越多,激活值也会越大。因此,我们希望...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
...。具体来说,为了支持图像输入,Meta 训练了一组适应器权重(adapter weight),其可将预训练的图像编码器集成到预训练的语言模型中。该适应器由一系列交叉注意层组成,这些层的作用是将图像编码器表征馈送给语言模型。为...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...在后训练阶段,苹果对模型进行了压缩和量化,平均每个权重低于4位。量化后的模型通常会有一定程度的质量损失。因此,研发团队并不是直接将量化模型交给应用团队进行功能开发,而是附加了一组参数高效的LoRA适配器来恢...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...中文大海捞针测试,同样做到了98%以上的准确率。除模型权重外,该模型的微调训练代码,推理代码等全套工具集也被一并开源,大模型相关开发者可做到“开箱即用”。据IT之家此前报道,周鸿祎曾表示,前段时间大模型行业...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...m但比较遗憾的是,目前在HuggingFace仓库中还没有公开模型权重。英伟达官方博客显示,ESM3将在Nvidia BieNeMo平台提供一个小型开源版本的代码和权重,但仅限于非商业用途。仓库地址:https://huggingface.co/EvolutionaryScale/esm3-s……更多
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
...文献搜索和文献综述工作,而且做到了数据、代码、模型权重的全方位开源。LLM集成到搜索引擎中,可以说是当下AI产品的一个热门落地方向。前有Perplexity横空出世,后有谷歌Gemini和OpenAI的SearchGPT纷纷加入。就在11月23日,有人...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...的影响。 本次Meta更新了Meta Segment Anything Model 2.1 (SAM 2.1)权重,性能更强。开源链接:https://github.com/facebookresearch/sam2相比SAM2,研究人员引入了额外的数据增强技术来模拟视觉相似物体和小物体,并……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...可生成高质量3D资产,已在技术社区公开发布,包含模型权重、推理代码、模型算法等完整模型,可供开发者、研究者等各类用户免费使用。本次开源的是1.0版本,后续还会有更完善、更先进的模型陆续发布。3D生成是一个较新...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...是开放的,但只限于研究和非商业用途。它提供了开放的权重,允许第三方根据自己的需求对模型进行微调。这一协议是对用户使用条件的一个重要限制。对于需要自行部署 Mistral Large 2 的商业用途,必须提前获取 Mistral AI 商业...……更多
火爆全球的AI音频大模型,最新技术细节揭秘
...动音频生成技术的发展和普及。目前,Stable Audio Open模型权重可在机器学习模型平台Hugging Face上获取。Stability AI鼓励声音设计师、音乐家、开发人员以及任何对音频感兴趣的人探索该模型的功能并提供反馈。来源:Stability AI ……更多
MSRA:视觉生成六大技术问题
...分析结果。其次,按照常规配置,对四种损失赋予相同的权重。基于这些假设,可以按以下方式简化重构损失的计算:因此,最小化图像级重构损失的潜在空间表示将是:这不能保证x0+x1+x2+x3比x0+x1+x2更接近arg min X。假设不同深...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...个全新的模型架构。在图像输入方面,训练了一组适配器权重,将预训练的图像编码器集成到预训练的大语言模型中。具体来说,该适配器:由一系列交叉注意力层组成,负责将图像编码器的表示输入进大语言模型通过在文本-...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...,这是迄今为止性能最好的「真正开源」的模型,不仅有权重和训练代码,而且是基于开放数据集DCLM-Baseline。相比模型性能,DCLM做出的「真正开源」的典范更加引人关注。对比大部分科技巨头只搞闭源模型,或「犹抱琵琶半遮...……更多
苹果AI版iOS首日火爆:聊天秒变高情商,大模型成最强嘴替
...是在此基础之上蒸馏得到。 继续训练时,低质量数据的权重会被降低,并使用数学、代码以及获得授权的高质量数据,对模型能力进行提升。该过程使用了1T tokens的数据,窗口长度也从4096变成了8192。到了下一阶段,窗口长度...……更多
真香!智谱大模型,有了首个免费的API
... 2000 位,先到先得。智谱还将开放 GLM-4-Flash 模型的微调权重下载,很快人们将可以自由选择部署平台。这一系列行动,展示了国内大模型公司在应用层面的独特优势。在大模型技术对标国际先进水平的同时,国内 AI 的先头部队...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...多数 MoE 模型都是闭源的,虽然有些模型公开发布了模型权重,但有关训练数据、代码等的信息却很有限,甚至有些研究没有提供这些信息。由于缺乏开放资源和对研究细节的深入探索,在 MoE 领域无法构建具有成本效益的开源...……更多
马斯克要求OpenAI恢复开源,背后是开源闭源路线之争
...最重要的部分,例如用于训练其大语言模型和预训练模型权重的完整数据集。这或多或少类似于Meta开源LLaMA的方式。”AI巨头的决裂2月29日,马斯克在旧金山法院对OpenAI及公司CEO阿尔特曼和总裁布罗克曼提起诉讼,震惊全球科技...……更多
首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人
...领悟”(Grokking)现象,《解锁 Grokking:Transformer模型中权重初始化策略的比较研究》本文首次系统研究了权重初始化对grokking的影响,比较了五种权重初始化策略,以优化神经网络学习动态。结果发现:Xavier初始化在多数任务中...……更多
专家模型不要专家并行!微软开源MoE新路径
...型,GPT-3.5表示感受到时代的力量,默默退出群聊。开放权重:https://huggingface.co/microsoft/GRIN-MoEdemo:https://github.com/microsoft/GRIN-MoEMoE全新训练路径GRIN MoE由常规的Transformer块构成……更多
更多关于科技的资讯:
《封神2》口碑争议大:有人打满分有人打零分 观众批评剧情狗血
快科技1月30日消息,春节假期休息的你去电影院看片了吗,如果去看会首选《封神第二部:战火西岐》吗?1月29日,《封神第二部:战火西岐》在春节档上映
2025-01-30 23:38:00
撒贝宁浓重眉毛冲上热搜 为啥人的眉毛这么重要
2025 年央视春晚上,撒贝宁因眉毛过粗登上热搜,被网友戏称为“浓眉大眼”以及“蜡笔小新同款眉”。就连撒贝宁自己也在节目里吐槽了这个梗
2025-01-30 23:38:00
7片三折扇叶!影驰RTX 5080圣刃OC显卡图赏
快科技1月30日消息,影驰最新发布了RTX 5080圣刃OC显卡。现在这款新品已经来到我们评测室,下面为大家带来图赏。影驰RTX 5080圣刃OC显卡搭配刃式装甲进行外观设计
2025-01-30 23:38:00
几何秩序美!索泰RTX 5080 16GB SOLID OC显卡图赏
快科技1月31日消息,索泰RTX 5080 16GB SOLID OC显卡现已发布。现在这款新品已经来到我们评测室, 下面为大家带来图赏
2025-01-31 07:38:00
经典的红黑配色!耕升RTX 5080追风OC显卡图赏
快科技1月31日消息,耕升RTX 5080追风显卡正式发布,为游戏玩家带来了新一代利器。现在这款新品已经来到我们评测室
2025-01-31 07:38:00
春节档最新预测票房:《哪吒》破50亿超第一部《射雕》仅8亿
快科技1月31日消息,据灯塔AI显示,影片《哪吒之魔童闹海》预测票房上调至50.5亿。2019年上映的《哪吒之魔童降世》最终票房为50
2025-01-31 07:38:00
给一整个国家加上杠杆:家电补贴都改变了什么
家电补贴,是最近几个月横贯在所有国内消费者心中的一个词,似乎每次遇到国内经济状况面临较大压力时,家电补贴都会强势上线。它就像一个终极版本答案一样
2025-01-31 08:08:00
人类计时器“天花板” 这种钟的误差可以达到3000亿年只差1秒
发现并归纳元素周期律的门捷列夫曾经说过,“科学是从测量开始的”,这句话的意思是说,没有精密测量就没有现代自然科学,而测量精度的提高往往会带来新的科学规律发现
2025-01-31 08:08:00
“大家值班辛苦了,今天的情况怎么样?”1月29日8时30分,雄安城市计算中心内的雄安云网科技有限公司(以下简称“雄安云网公司”)总经理助理曹英走进雄安城市计算中心地下一层的智能城市运维中心
2025-01-31 08:37:00
雷峰塔下真的有压了千年的白色虫子:发现时还活着
1月31日消息,看完蛇年春晚《借伞》,唤醒了人们对《白蛇传》这一经典传说的美好记忆,也让杭州这座充满浪漫与传奇色彩的城市再次成为众人瞩目的焦点
2025-01-31 08:38:00
本田调整组织架构:整合软件定义汽车业务 新增汽车开发部门
快科技1月31日消息,快科技1月31日消息,据媒体报道,本田技研宣布将于2025年4月1日起进行一系列组织和运营改革。据悉
2025-01-31 08:38:00
DeepSeek向中国科技公司发倡议:携手抵抗美国打压!官方回应
快科技1月31日消息,近日网上流传了一份DeepSeek母公司深度求索发出的倡议书,其中号召中国科技公司团结起来。从倡议书中可以看到
2025-01-31 09:08:00
优派新款23.8寸显示器仅399元:1080P 144Hz高刷屏
快科技1月31日消息,优派推出了新款23.8寸显示器VA24G25,首发仅399元。这款显示器配备23.8寸IPS面板
2025-01-31 09:38:00
40多万才买1年的奔驰车被烧毁 女车主淡定比耶拍照:发言更是绝
1月31日消息,据国内媒体报道称,近日在江西九江都昌县,一辆尼桑车停在鞭炮灰烬上起火,殃及旁边的奔驰车,导致两车烧毁。上述事件也是引发了网友的热议
2025-01-31 09:08:00
影驰GeForce RTX 5080圣刃OC显卡评测:小尺寸高性能 高端玩家完美之选
一、前言:更贴近游戏玩家需求的准旗舰显卡NVIDIA在2025年开年推出了全新的GeForce RTX 50系显卡,旗舰级别的GeForce RTX 5090 D价格直接来到了16000元之上
2025-01-30 22:38:00