模型,大小,语言,模型,性能,英伟头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

谷歌发布gemma2大语言模型，共有两种大小

...布新闻稿，面向全球研究人员和开发人员发布Gemma2大语言模型，共有90亿参数（9B）和270亿参数（27B）两种大小。Gemma2大语言模型相比较第一代，推理性能更高、效率更高，并在安全性方面取得了重大进步。谷歌在新闻稿中表示...……更多

2024-06-28 10:18:00模型,大小,语言,模型,性能,英伟

微软、英伟达纷纷押注小模型，大模型不香了？

...发展的道路上，科技巨头们曾经竞相开发规模庞大的语言模型，但如今出现了一种新趋势：小型语言模型（SLM）正逐渐崭露头角，挑战着过去“越大越好”的观念。视觉中国当地时间8月21日，微软和英伟达相继发布了最新的小型...……更多

2024-08-26 14:17:00模型,英伟,微软,模型,训练,性能

定价15000！老黄重磅发布RTX 5090：世界最小AI超

...I超级计算机——Project Digits。有多强悍？ 2000亿参数的大模型，直接在你办公桌上（自己的桌面系统）就能跑！如果把两台Project Digits一块“食用”，那么还可以跑4050亿参数的大模型。据了解，每个Project DIGITS配备了128GB统一、...……更多

2025-01-07 14:17:00老黄,重磅,定价,计算机,世界,模型

PyTorch官宣：告别CUDA，GPU推理迎来Triton

...0%的Triton内核Pytorch最近发表了一篇技术博客，他们以两个模型——Llama3-8B和IBM的Granite-8B Code为例，100%使用Triton内核实现了FP16推理。Granite-8B Code是由IBM开发的一种仅限解码器的代码模型，专为代码生成任务设计。仓库地址：……更多

2024-09-07 09:48:00新时代,推理,内核,矩阵,乘法,英伟

英伟达地表最强，黄教主被称作AI界“霉霉”

...多款重磅明星产品，目前市面上能叫得上名字得人工智能模型几乎都是在该架构上进行训练，行业内“一芯难求”的局面迟迟得不到缓解。而今年，按照英伟达每两年更新一次GPU架构的节奏，大家都对英伟达新一代计算平台翘首...……更多

2024-03-19 11:56:00英伟,地表,教主,英伟,模型,人工智能

晶圆级AI芯片WSE-3性能公布：80亿参数模型上每秒生成1

...上一代WSE-2的两倍，可用于训练业内一些最大的人工智能模型。在近日的Hot Chips 2024大会上，Cerebras Systems详细介绍了这款芯片在AI推理方面的性能。根据官方资料显示，WSE-3依然是采用了一整张12英寸晶圆来制作，基于台积电5nm制...……更多

2024-09-02 13:36:00晶圆,芯片,生成,模型,性能,参数

碾压所有对手？谷歌发布轻量化开源大模型，笔记本电脑就可跑

开源大模型赛道迎来重磅新品。当地时间2月21日，谷歌宣布正式推出全新的开源大语言模型（LLM）“Gemma”，旨在帮助开发人员和研究人员负责任地构建人工智能。据介绍，Gemma大模型与谷歌规模最大、能力最强的人工智能模型...……更多

2024-02-22 12:44:00模型,对手,笔记本,笔记,电脑,模型

多模态竞技场对标90B Llama 3.2！Pixtral

...杀入江湖的Mistral AI，在9月份甩出了自家的首款多模态大模型Pixtral 12B，如今，报告之期已至，技术细节全公开。作为欧洲的OpenAI，Mistral最近压力不小。端侧小模型端不出来，对比评测的结果又遭到质疑。上个月震撼登场的自家...……更多

2024-11-20 09:43:00模态,竞技场,竞技,报告,技术,模态

前谷歌工程师创业造AI芯片！产品明年问世，已拿到1.8亿融资

...MatX正在挑战英伟达在AI芯片领域的霸主地位，其为大语言模型训练而设计的AI芯片将于明年问世。这家公司的官网显示，使用MatX芯片，训练70B大模型的延迟将小于10ms/token。该公司还预言，使用其芯片训练，能够让世界上最好的...……更多

2024-03-30 11:11:00融资,芯片,工程师,创业,工程,产品

苹果开源7B模型，训练过程数据集一口气全给了，网友：很不像苹

苹果最新杀入开源大模型战场，而且比其他公司更开放。推出7B模型，不仅效果与Llama 3 8B相当，而且一次性开源了全部训练过程和资源。要知道，不久前Nature杂志编辑Elizabeth Gibney还撰文批评：许多声称开源的AI模型，实际上在...……更多

2024-07-23 09:33:00苹果,一口,模型,一口气,训练,过程

英伟达发布mistral-nemoai大语言模型

...国初创公司MistralAI，今天发布了全新的Mistral-NeMoAI大语言模型，拥有120亿个参数，上下文窗口（AI模型一次能够处理的最大Token数量）为12.8万个token。VentureBeat与Midjourney合作制作Mistral-NeMoAI大模型主要面向企业环境，让企……更多

2024-07-19 22:18:00英伟,模型,语言,人工智能,模型,人工

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平，其在纯文本性能甚至超过了LLM骨干模型，特别是在文本数学和编码基准测试中，平均准确率提高了4.3个百分点。文本...……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

加速AI落地企业！微软解读Copilot技术栈，云端混合大小

...试用推广、团队扩张。一、Copilot平台推出Agent能力，小模型满足端侧需求在Scaling Laws下，AI技术的能力大约每六个月就会翻倍增长。陶然谈道，如何让技术成果对齐行业、企业的实际业务需求，加速技术能力的落地转化，成为...……更多

2024-06-15 09:29:00微软,云端,落地,混合,模型,大小

英伟达llama-3.1-minitron4bai模型发布

...，英伟达公司联合Meta公司发布了最新的Llama-3.1-Minitron4BAI模型，主要通过结构化权重剪枝、知识提炼等尖端技术，成功蒸馏（Distill）出40亿参数的“小而强”模型。图源：英伟达Llama-3.1-Minitron4B模型在Llama-3.1-Minitron8B基础上……更多

2024-08-18 01:38:00英伟,模型,模型,英伟,技术,结构化

4090笔记本0.37秒直出大片！英伟达联手MIT清华祭出S

...合成高分辨率、高质量，且具有强文本-图像对其能力的模型。而且，它还能高效生成高达4096×4096像素的图像。项目主页：https://nvlabs.github.io/Sana/论文地址：https://arxiv.org/abs/2410.10629Sana的核心设计包含了以下几个要素：深……更多

2024-10-18 09:49:00英伟,清华,架构,大片,性能,笔记本

英伟达发布80亿参数的ai模型

...伟达（NVIDIA）宣布，其已成功研发并发布了一款全新的AI模型，该模型拥有高达80亿的参数规模，具备精度高、计算效率高等优点，可在GPU加速的数据中心、云和工作站上运行。据介绍，这款新发布的AI模型是基于英伟达在深度学...……更多

2024-08-24 05:15:00英伟,模型,参数,模型,英伟,应用

老黄祭出史上最强 AI 芯片B200！30倍性能提升，AI

...）Blackwell，是英伟达A100/H100系列AI GPU的继任者。在大语言模型推理工作负载方面，Blackwell的性能相比H100 GPU提升了30倍，能耗却降低了25倍。亚马逊、谷歌、微软和甲骨文将是首批合作伙伴。此外，黄仁勋还在GTC大会推出了新一款...……更多

2024-03-19 13:00:00老黄,摩尔,定律,芯片,性能,媒体

DeepSeek被美国质疑“偷窃”，遭OpenAI微软调查

...暂未回应。值得一提的是，此前许多外界人士认为通过模型蒸馏技术，DeepSeek可能在训练过程中使用了 ChatGPT 等模型的输出数据作为训练材料，而这些数据中的「知识」被迁移到 DeepSeek 自己的模型中。事实上，这种做法在 AI 领...……更多

2025-01-29 21:29:00微软,美国,调查,模型,英伟,训练

支持1024帧、准确率近100％，英伟达「LongVILA」

现在，长上下文视觉语言模型（VLM）有了新的全栈解决方案 ——LongVILA，它集系统、模型训练与数据集开发于一体。现阶段，将模型的多模态理解与长上下文能力相结合是非常重要的，支持更多模态的基础模型可以接受更灵活...……更多

2024-08-22 09:51:00英伟,准确率,支持,视频,序列,训练

英伟达深夜炸场，世界最强AI芯片H200震撼发布，性能飙升9

...两款芯片还是互相兼容的。这意味着，使用H100训练/推理模型的企业，可以无缝更换成最新的H200。全世界的AI公司都陷入算力荒，英伟达的GPU已经千金难求。英伟达此前也表示，两年一发布的架构节奏将转变为一年一发布。就...……更多

2023-11-14 13:41:00英伟,芯片,性能,世界,英伟,显存

AI“卖铲人”英伟达，为何业绩再爆发？

...智能在2023迎来爆发，生成式AI以ChatGPT为代表掀起全球大模型浪潮，全球各行业的算力需求激增。英伟达GPU作为主流AI训练解决方案使其成为最大受益者，实现量价双收。英伟达财报也揭示了未来发展战略的三大方向：一是以数据...……更多

2024-05-25 09:55:00英伟,业绩,英伟,业务,领域,汽车

英伟达尖端图像处理半导体h200开始供货

...英伟达方面公布的性能评测结果，以Meta公司旗下大语言模型Llama2处理速度为例，H2000相比于H100，生成式AI导出答案的处理速度最高提高了45％。市场调研机构Omdia曾表示，2022年英伟达在AI半导体市场约占8成的份额，与此同时AMD等...……更多

2024-03-30 02:04:00英伟,图像处理,尖端,半导体,供货,图像

微软难以摆脱英伟达｜焦点分析

...市场至少90%的份额。AI芯片是AI时代石油一般的存在。大模型公司想更快推出模型和AI应用，就必须大量购入英伟达的芯片。而英伟达的产能有限，按照上一年计划制定的供给，远不能满足蓬勃的市场需求，抢不到芯片的云厂商、...……更多

2023-11-20 13:32:00英伟,微软,焦点,分析,英伟,芯片

英特尔推出新款AI芯片：推理性能比英伟达H100快50%

...大飞跃。英特尔Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型，以及1750亿参数GPT-3模型的训练时间。英特尔表示，Gaudi 3能够比英伟达上一代H100处理器训练特定大型语言模型的速度快40%，在推理端比英伟达H100快50%。基辛格在现场...……更多

2024-04-10 10:52:00英特,英特尔,英伟,能比,推理,芯片

英伟达发布Llama-3.1-Nemotron-51B AI

...伟达 9 月 23 日发布博文，宣布推出 Llama-3.1-Nemotron-51B AI 模型，源自 Meta 公司的 Llama-3.1-70B，不过创新使用神经架构搜索（NAS）方法，建立了一个高度准确和高效的模型。Llama-3.1-Nemotron-51B 简介Llama-3.1-……更多

2024-09-26 09:49:00英伟,模型,模型,英伟,精度,内存

开源大模型杀疯了！Mistral新模型三分之一参数卷爆Lla

Llama 3.1 405B“最强模型”宝座还没捂热乎，就被砸场子了——Mistral AI发布最新模型Mistral Large 2，参数123B，用不到三分之一的参数量性能比肩Llama 3.1 405B，也不逊于GPT-4o、Claude 3 Opus等闭源模型。主打的就是一个高性价比。用官……更多

2024-07-26 09:39:00模型,参数,模型,基准,问题,推理