模型,模型,数据,内存,性能,训练头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

北大林宙辰团队全新混合序列建模架构MixCon：性能远超Ma

...领域中，序列建模是一项至关重要的任务。然而，现有的模型在捕捉长程依赖关系和高效建模序列方面仍面临诸多挑战。因此，北京大学林宙辰、徐鑫提出了一种全新混合序列建模架构 ——MixCon，它为解决这些难题带来了创新...……更多

2024-10-16 13:34:00序列,架构,北大,混合,团队,性能

大模型观察｜从训练到落地金融业，大模型“升级之路”面临哪些挑

迎着技术风口，2024年将是AI大模型应用的浪潮年。业界认为，大模型将对金融业产生长远的、深刻的影响。1月28日，针对大模型在各业务场景的应用成效、对大模型算力的开发和提升，多机构向北京商报记者透露了自研大模型...……更多

2024-01-29 21:36:00模型,之路,金融业,落地,观察,训练

“技术故障”背刺巴菲特，金融大模型到底靠不靠谱？

...忧——传统软件问题尚能引发如此大的问题，那么站在大模型时代当下，AI+金融，是否又能做到准确可信？正所谓实践是检验真理唯一标准，要回答的这个问题，我们不妨了解一下已经在金融领域“上岗”了的AI大模型。大模型...……更多

2024-06-28 23:00:00巴菲,巴菲特,模型,故障,金融,技术

英伟达blackwell计算引擎制造商推出的ai模型

...最新这代Blackwell计算引擎的出炉，面向生成式AI的大语言模型则进一步推动架构的发展，强调不断压缩更大规模AI训练与推理工作负载的处理成本。英伟达公司超大规模与HPC副总裁IanBuck在大会前的简报中解释道，“在过去的2023年...……更多

2024-03-20 02:59:00英伟,制造商,模型,引擎,制造,英伟

清华团队提出大模型“密度定律”；足球领域首个视觉语言基础模型

今日值得关注的大模型前沿论文SwiftEdit：50 倍速文本引导图像编辑清华团队提出大模型“密度定律”足球领域首个视觉语言基础模型Aguvis：首个完全自主的纯视觉 GUI agentGoogle DeepMind：利用运动轨迹控制视频生成大模型数学新基...……更多

2024-12-10 09:53:00模型,语言基础,清华,定律,密度,团队

OpenCity大模型预测交通路况，零样本下表现出色，来自港

长时间交通状况预测，可以用大模型实现了。香港大学联合华南理工大学和百度，推出了长时间城市交通预测模型——OpenCity。而且泛化能力极强，可有效应用于广泛的交通预测场景。为了解决传统交通预测模型泛化性及长期预...……更多

2024-09-02 13:34:00路况,样本,模型,交通,交通,模型

江波龙512GB CXL AIC内存扩展卡亮相

人工智能大模型计算、高性能计算(HPC)以及数据中心等行业的迅猛发展，对计算机系统内存性能的需求日益提升。江波龙此前于CFMS2024展出了一款基于Compute Express Link (CXL)技术的创新内存扩展设备——CXL 2.0 AIC内存扩展卡...……更多

2024-05-03 14:15:00江波,内存,内存,直插式,江波,高性能

ai生命周期：ai训练和ai推理的完美结合

...部分，一个是AI训练，一个是AI推理。其中，AI训练就是让模型识别数据模式，是数据和处理最密集的部分，需要大规模的算力。在这一阶段，往往优先使用大规模并行的GPU加速器或专用的AI加速器，有时候根据情况也可以使用超...……更多

2024-03-15 02:13:00推理,周期,训练,生命,推理,能效

云计算一哥终于搞多模态了：一口气6个大模型，还有个3nm芯片

就在刚刚，云计算一哥亚马逊云科技，在大模型这件事儿上搞了波大的——亚马逊CEO Andy Jassy亲自站台re:Invent24，发布自家新款AI多模态系列大模型，名曰Amazon Nova。而且是一口气涵盖文本对话、图片生成、视频生成，甚至直接吐...……更多

2024-12-05 09:45:00模态,一口,芯片,模型,一口气,亚马

AI手机没有独家大模型供应商

...浪潮便席卷而来。手机，作为全民终端产品，更是成为大模型硬件落地潮的浪头。国内手机厂商方面，OPPO宣布2024是AI手机元年，魅族则称将正式停止传统智能手机新项目，双双All in AI。海外备受关注的苹果放弃十年造车梦，转...……更多

2024-07-25 11:54:00模型,供应商,供应,手机,模型,手机

vivo发布自研蓝心大模型及蓝河操作系统、OriginOS

...1月1日，2023 vivo开发者大会上，vivo正式发布了自研蓝心大模型BlueLM、OriginOS 4、自研蓝河操作系统BlueOS。vivo副总裁、OS产品副总裁周围发布了“1+2+N”的智能系统体验。其中的1，即vivo自研通用大模型矩阵——蓝心大模型BlueLM；2，...……更多

2023-11-07 14:24:00模型,系统,系统,模型,能力,开发

拥有三块A6000的性能猛兽惠普Z6 G5工作站评测

...海量数据的计算能力需求日益增长。基于深度学习的训练模型需要搭载多块高端GPU来进行并行运算,对工作站提出了更高的硬件要求。为满足AI计算的巨大需求,惠普推出全新一代旗舰工作站Z6 G5。惠普Z6 G5最引人瞩目的自然是其支...……更多

2023-11-07 13:51:00惠普,猛兽,工作站,评测,性能,工作

新一代aigc技术的发展

...决方案——DDC技术。GPU负载共享的三种方法前述AIGC大型模型的卓越能力不仅来自于其庞大的数据量，也源于算法的不断演进和进步。在训练这些大型模型时，通常需要利用多个GPU来分担工作负载。为实现高效的负载共享，采用3...……更多

2024-02-16 12:06:00新一代,发展,技术,网络,模型,数据

戴尔以技术创新推动AI基础架构升级

...蓬勃发展的AI应用背后离不开底层基础设施的支持。以大模型的训练和推理为例,大模型的参数量已经从数十亿增加到几百亿、几万亿甚至更高,更大的模型带来了更大的AI算力需求。有数据显示,AI所消耗的算力平均每3至4个月就会...……更多

2024-04-22 18:00:00戴尔,技术创新,架构,升级,基础,技术

英伟达推出史上最强AI芯片H200：推理性能提升90%，无缘

...最先进的H100的带宽和容量分别为3.35TB和80GB。这将提升大模型在推理方面的表现，并有助于提升高性能计算应用的计算能力。英伟达预计，H200将在明年二季度开始发货，谷歌、微软、甲骨文等科技巨头将会率先实现首批部署。但...……更多

2023-11-14 14:05:00英伟,中国,推理,芯片,性能,市场

比Stable Diffusion便宜118倍！1890美元

...研究人员，利用延迟掩蔽、MoE、分层扩展等策略，将扩散模型的训练成本降到了1890美元。训练一个扩散模型要多少钱？之前最便宜的方法（Wuerstchen）用了28400美元，而像Stable Diffusion这样的模型还要再贵一个数量级。大模型时代...……更多

2024-08-13 09:42:00文生,高质量,模型,参数,模型,训练

用60%成本干80%的事，DeepSeek分享沉淀多年的高性

... 3 倍、DRAM 带宽增长 1.6 倍、互连带宽则仅有 1.4 倍。而大模型是大数据 + 大计算的产物，其参数量可达千亿乃至万亿规模，需要成千上万台 GPU 才能有效完成训练。这些实际情况提升了人们对高性能计算（HPC）的需求。为了获得...……更多

2024-09-07 09:44:00高性能,架构,深度,多年,成本,学习

你敢要它就有！至强6新品治好选择困难症

...，新兴业务需要提质增量。传统业务混合AI负载在大模型蔚为风潮的背景下，至强6性能核拥有更多的内核、较大的内存带宽，以及AMX这类为AI任务优化的加速器，不论是传统的神经网络推理，还是Transformer大语言模型推理的性...……更多

2025-03-24 15:46:00新品,困难,选择,性能,产品线,处理器

RNN回归！Bengio新作大道至简与Transformer

...坛。然而，人们并没有忘记RNN。RWKV、Mamba、xLSTM等RNN衍生模型接连出现，欲挑战Transformer之霸主地位。就在近日，又有重量级人物下场——深度学习三巨头之一的Yoshua Bengio，带领团队推出了全新的RNN架构，以大道至简的思想与Tran...……更多

2024-10-26 09:53:00高下,新作,大道,门控,模型,训练

高文院士：鹏城实验室已训练3个大模型，今年底将拥有两万多块卡

...城实验室主任高文发表演讲，分享了鹏城实验室在打造大模型平台上的进展。他表示，大模型训练首先需要一个平台。“现在要想训练一个大模型，需要有几千块卡，甚至上万块卡。”他介绍到，鹏城实验室在2020年就搭建了这...……更多

2024-06-05 13:00:00高文,院士,实验室,模型,训练,实验

微调大模型，AMD MI300X就够了！跟着这篇博客微调Ll

随着 AI 模型的参数量越来越大，对算力的需求也水涨船高。比如最近，Llama-3.1 登上了最强开源大模型的宝座，但超大杯 405B 版本的内存就高达 900 多 GB，这对算力构成了更加苛刻的挑战。如何降低算力的使用成本和使用门槛，...……更多

2024-10-09 09:52:00模型,跟着,博客,模型,参数,训练

AMD发布首个AI小语言模型：6900亿token、推测解码

快科技10月1日消息，AMD发布了自己的首个小语言模型(SLM)，名为“AMD-135M”。相比于越来越庞大的大语言模型(LLM)，它体积小巧，更加灵活，更有针对性，非常适合私密性、专业性很强的企业部署。AMD-135小模型隶属于Llama家族，...……更多

2024-10-01 17:04:00小语,提速,模型,模型,性能,训练

亚马逊云科技最强AI硬件猛兽背后，工程细节详细解读

... 三、打造最强AI硬件猛兽，背后的技术秘方训练更大的模型，需要构建更好的AI基础设施、更强大的服务器集群。这要求有更好的AI芯片和AI网络。在re:Invent大会上，亚马逊云科技着重公布了几个重磅AI硬件产品。一是亚马逊和Ant...……更多

2024-12-16 09:15:00亚马,亚马逊,猛兽,细节,背后,硬件

一文读懂黄仁勋CES重磅发布：最新5090芯片、世界最大AI

...上最大最快的巨型芯片Grace Blackwell NVLink72、首个世界基础模型Cosmos等，并公布了在AI代理、物理AI等方面的布局和进展。新一代GeForce RTX 50系列芯片，最高售价1999美元黄仁勋开场就开玩笑称“你们现在就在我们的数字孪生世界里...……更多

2025-01-07 19:00:00一文,世界,重磅,芯片,模型,计算机

定价15000！老黄重磅发布RTX 5090：世界最小AI超

...I超级计算机——Project Digits。有多强悍？ 2000亿参数的大模型，直接在你办公桌上（自己的桌面系统）就能跑！如果把两台Project Digits一块“食用”，那么还可以跑4050亿参数的大模型。据了解，每个Project DIGITS配备了128GB统一、...……更多

2025-01-07 14:17:00老黄,重磅,定价,计算机,世界,模型

Enfabrica推出全球最快GPU网络接口控制器芯片，获1

...这一点同样适用。对于训练上千亿甚至万亿参数的大规模模型来说，单个 GPU 的处理能力已经显得微不足道，计算任务往往需要由大型显卡集群协同完成。然而，当前 GPU 内存容量和性能正在迅速增长，但输入/输出（I/O）性能的...……更多

2024-11-22 13:31:00控制器,融资,芯片,接口,控制,全球

amd发布新一代面向ai/hpc加速器

...3倍；FP16TFLOPS精度是H100的1.3倍；在1v1比较中，训练Llama270B模型速度比H100快20%；在1v1比较中，训练FlashAttention2模型速度比H100快20%；在8v8Server比较中，训练Llama270B模型速度比H100快40%；在8v8Server……更多

2023-12-08 09:59:00加速器,新一代,速度,加速器,精度,四代

Yandex推出开源大语言模型训练工具，称可节省高达20%的

...球科技公司Yandex推出了YaFSDP，这是一种用于训练大型语言模型(LLM)的开源方法。据介绍，YaFSDP是目前在大型语言模型训练中增强图形处理器（GPU）通信并减少内存使用量的公开可用的最有效工具，与FSDP相比，根据架构和参数数量...……更多

2024-06-18 16:13:00处理器,图形,模型,高达,训练,语言

腾讯推出 Hunyuan-Large 开源大模型

IT之家11月5日消息，腾讯今日宣布推出Hunyuan-Large大模型，官方表示这是目前业界已经开源的基于Transformer的最大MoE模型，拥有3890亿总参数（389B）和520亿激活参数（52B）。腾讯今日在HuggingFace开源了Hunyuan-A52B-Pretrain、Hun……更多

2024-11-05 18:56:00腾讯,模型,模型,长上,腾讯,训练