提速,推理,显卡,微软,模型,性能头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

Pika爆火，但AI视频还没到「GPT时刻」；首个GPT-4

...发布了一个仅有27亿参数的小型模型Phi-2，它在多数常识推理、语言理解、数学和编码任务上超越了其他大型模型。尽管Phi-2的参数数量较少，但它在复杂的基准测试中展示了出色的性能，甚至超越了参数数量是其25倍的模型。微...……更多

2023-12-14 09:34:00模型,微软,人形,早报,机器人,机器

GPU训Llama 3.1疯狂崩溃，竟有大厂用CPU服务器跑

...The」。完整的回复，花了整整20个小时熟悉模型的训练和推理的朋友都知道，这些事情一点都不奇怪。集群搭建（GPU配置、网络设计、轨道优化等）、集群管理（实时监控、故障排除等）……个个都是「拦路虎」。对于缺乏相关...……更多

2024-08-02 09:47:00大厂,模型,参数,疯狂,服务器,服务

谷歌王者归来？最新推出的大模型到底有多强，能否挑战GPT-4

...问题，这就使其尤其擅长解释数学和物理等复杂科目中的推理。Gemini能够根据照片按步骤讲题。来源：官方视频谷歌还发布了一个时长六分钟的视频，展现了测试员和Gemini的一些有趣互动，其中包括让Gemini识别图片并用多种语言...……更多

2023-12-07 18:27:00王者,模型,模型,视频,微软,测试

GTC 2024硬件一览：史上最强AI芯片GB200发布！

...可实现720petaflops的AI训练性能或1,440petaflops（1.4exaflops）的推理。图片源于网络与相同数量的72个H100相比，GB200NVL72的性能绝对是逆天的存在，大模型推理性能可以提升30倍，并且成本和能耗只有前者的1/25。当然，最炸裂的要数适...……更多

2024-03-24 17:39:00一览,芯片,硬件,老黄,架构,图片

AIGC风潮席卷手机：但在PC面前还是个弟弟

...全新的NPUAI独立引擎。它通过单独设置的神经计算引擎、推理流水线，彻底接手端侧的AI推理负载，其中MAC阵列可以高效执行矩阵算法和卷积运算，每周期效率多达2048。这样的性能更是手机端望尘莫及的，速度超快的同时功耗更...……更多

2023-11-19 18:15:00风潮,弟弟,还是,手机,模型,生成

NPU全球出货超1亿颗！芯原如何迎战大模型时代的边缘计算变革

...C9X00AI是AI-GPU/AI-PC，Tensor Core GPU IP CCTC-MP则面向大语言模型推理、训练。芯原NPU IP研发副总裁查凯南谈道，NPU的发展近年来大概有三个方向：首先是DEEP AI，在很多嵌入式设备里面，要把AI跟其它的处理IP做比较紧耦合的绑定，可以...……更多

2024-06-14 09:18:00变革,模型,边缘,时代,全球,模型

无惧4K游戏、AI高产利器，RTX 4070 Ti SUPE

...越快。Stable Diffusion支持TensorRT，这是NVIDIA推出的深度学习推理SDK，能优化推理性能、加速各种工作负载，并支持大型语言模型推理。测试中，常规的Stable Diffusion绘图需要166.7秒，而经过TensorRT加速后仅需99.2秒，速度提升了68%，……更多

2024-02-27 11:35:00实测,高产,利器,显卡,显卡,微星

阿里巴巴“AI驱动”战略提速夸克发布自研大模型

本文转自：新华网11月14日，阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型，将应用于通用搜索、医疗健康、教育学习、职场办公等众多场景。夸克App将借助自研大模型全面升级，加速迈向年轻人工作、学习...……更多

2023-11-14 16:05:00夸克,阿里巴巴,阿里,提速,模型,驱动

万元内的高性价比专业卡——AMD Radeon Pro W7

...实验室的Procyon Windows AI性能测试项目将对Radeon Pro W7700的AI推理运算性能进行了测试。从测试成绩可以看到，相比Radeon Pro W7600，Radeon Pro 7700的整体性能领先在15%~80%，平均领先程度约为40%。从FP32和FP16的AI推……更多

2023-11-14 17:06:00性价比,显卡,专业,性能,测试,专业

大模型步入推理Scaling时代,SambaNova如何挑战

...全采用高效的数据流架构，这从根本上限制了 GPU 推理的提速。当前的几家主流 AI 芯片 Startup，都选择了数据流架构。其中来自 SambaNova 的 RDU 展现出了独特优势，也被视为 GPU 的最有力竞争者。与英伟达相比，Sambanova 最新 Llama 3...……更多

2024-10-21 09:55:00英伟,霸主,推理,模型,地位,时代

00后华裔小哥哈佛辍学组团挑战英伟达，史上最快AI芯片Soh

...元导读】史上最快Transformer芯片诞生了！用Sohu跑Llama 70B，推理性能已超B200十倍，超H100二十倍！刚刚，几位00后小哥从哈佛辍学后成立的公司Etached，宣布再融资1.2亿美元。有史以来最快的Transformer芯片，刚刚诞生了？去年21岁哈佛...……更多

2024-06-27 09:25:00小哥,英伟,哈佛,华裔,推理,芯片

微软发布旗下最小语言模型phi-2

...写电子邮件和故事，以及总结文本。在常识、语言理解和推理的基准测试中，该模型在某些领域能够跟上多达100亿个参数的模型。微软现在更新发布的Phi-2拥有27亿参数，规模虽然比此前版本翻番，但相比较其它主流语言模型，...……更多

2023-11-17 14:00:00微软,旗下,模型,语言,模型,微软

AMD公布全新AI加速卡路线图：CDNA 4架构明年见

...3E，根据AMD提供的PPT，与如今的RDNA3架构相比，RDNA4架构的推理性能提升幅度达到了35倍，而MI350与英伟达B200计算卡相比，内存容量提升了50%，而AI算力也高出了20%，至于到了2026年，AMD更是会推出“RDNNANext”架构，看起来也是一年...……更多

2024-06-05 17:19:00加速卡,路线图,架构,路线,全新,加速卡

AI背后的算力哪里来？高性能GPU成为行业追捧的香饽饽

...Pro图形显卡非常适合计算机辅助设计和建模（CAD/CAM）、AI推理以及一些商业环境中的媒体处理工作负载，为工作站显卡领域提供了新选择。2023年10月，英特尔又带来了锐炫独立显卡产品中的中端新品锐炫A580，面向游戏玩家和创...……更多

2023-12-30 03:35:00里来,饽饽,高性能,背后,行业,英特

每月141元的ChatGPT Plus订阅重新开放，背后发生

...」图/ X（Twitter）但算力依然受限，核心是大模型训练、推理都严重依赖于英伟达高端 GPU，而英伟达又受限于台积电先进芯片制造工艺、封装工艺以及韩国 HBM 内存的产能。说到底，还是算力不够用，「供给」赶不上「需求」。...……更多

2023-12-15 11:26:00订阅,背后,开放,英伟,芯片,模型

AI PC，联想Ready for PC | 焦点分析

...AI PC的发展阶段定义为“AI Ready”：“现在我们主要利用显卡来加强计算能力，计算能力的其中一个指标叫做TOPS（每秒钟可进行一万亿次操作）。现在的PC只能做到10 TOPS，我们觉得理想情况是要做到40 TOPS，才能算是AI第一代。”...……更多

2024-01-25 05:35:00焦点,分析,模型,联想集团,厂商,芯片

artemis今年正式投产，将应用于数据中心的推理

...今年正式投产。据了解，新的芯片将被应用于数据中心的推理任务，与英伟达等供应商的GPU一起协同工作。Meta发言人之前表示：我们相信，我们自主开发的加速器将与市面上的GPU相得益彰，为Meta的任务提供最佳的性能与效率平...……更多

2024-02-12 20:47:00数据中心,推理,应用,数据,英伟,芯片

晶圆级AI芯片WSE-3性能公布：80亿参数模型上每秒生成1

...Hot Chips 2024大会上，Cerebras Systems详细介绍了这款芯片在AI推理方面的性能。根据官方资料显示，WSE-3依然是采用了一整张12英寸晶圆来制作，基于台积电5nm制程，芯片面积为46225平方毫米，拥有的晶体管数量达到了4万亿个，拥有90...……更多

2024-09-02 13:36:00晶圆,芯片,生成,模型,性能,参数

AI浪潮中的美国科技七巨头

...布了两款人工智能专用芯片，分别是训练型芯片Trainium和推理型芯片Inferentia。亚马逊希望Trainium和Inferentia这两款芯片可以帮助人工智能初创公司降低AI训练和AI应用的费用，从而确立AWS在人工智能云服务领域的竞争优势。OpenAI首...……更多

2024-08-05 14:19:00美国科技,美国,浪潮,巨头,科技,人工智能

大模型降价背后，国产大模型的竞争逻辑变了

...市场拱手让人。另一方面，随着大模型产业的快速发展，推理成本飞速下降，也成为终端降价的基础。据百度官方透露，相比一年前，文心大模型的算法训练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了1...……更多

2024-05-29 09:29:00模型,逻辑,背后,国产,竞争,模型

Cerebras 推出全球最快AI推理解决方案，速度是英伟达

... 今日宣布推出 Cerebras Inference，官方称这是全球最快的 AI 推理解决方案。该新解决方案为 Llama 3.1 8B 提供每秒 1800 个 token，为 Llama 3.1 70B 提供每秒 450 个 token，速度是微软 Azure 等超大规模云中提供的基于英伟达……更多

2024-08-28 13:37:00英伟,方案,推理,解决方案,速度,全球