大厂,模型,参数,疯狂,服务器,服务头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

【新智元导读】是时候用CPU通用服务器跑千亿参数大模型了！马斯克19天建成由10万块H100串联的世界最大超算，已全力投入Grok 3的训练中。与此同时，外媒爆料称，OpenAI和微软联手打造的下一个超算集群，将由10万块GB200组成。...……更多

2024-08-02 09:47:00大厂,模型,参数,疯狂,服务器,服务

AI大厂硬刚价格战，中小模型夹缝求生存

...资源和成本也越相应增加。而承载超大参数量的背后则是服务器数量。据安信证券测算，目前ChatGPT每天所需的算力约50EFLOPs，所需服务器约1万台，若ChatGPT的用户量继续保持上涨，假设到24年底用户数量为5亿，则需要23万台服务...……更多

2024-06-24 09:26:00大厂,夹缝,价格战,模型,中小,价格

微软紧随英伟达发布芯片，老黄还不慌吗？

...大在于，建立了完整的自研芯片产业链，形成网络芯片、服务器芯片、AI芯片三条产品线。在AI芯片领域，亚马逊的自研产品就通用计算芯片、机器学习训练芯片、学习推理芯片等。满打满算，从2013年推出首款自研芯片Nitro1以来...……更多

2023-11-23 09:36:00老黄,英伟,微软,芯片,芯片,英伟

大模型应用疯狂加速，洗牌却在静悄悄进行了

...让腾讯具备了更强的“全局优化”能力。从自研的星星海服务器，到新一代HCC高性能计算集群，再到自研的星脉高速网络，腾讯已经为自己打造了一整套面向AIGC的高性能智算网络。据腾讯内部负责人介绍，目前腾讯云已经可支...……更多

2023-10-07 15:24:00模型,疯狂,应用,模型,腾讯,能力

国产GPU万卡集群终于来了！摩尔线程CEO张建中：做难而正确

...首先有自研全功能GPU，基于GPU做出计算加速卡，再组建成服务器，放进超融合一体机，然后将这样的4台机器整合到一个机柜里，形成一个小集群，小集群连成大集群，大集群的线性加速比高于91%。有了这样一个灵活组合的集群...……更多

2024-07-09 09:47:00摩尔,张建中,万卡,张建,集群,线程

大模型厂商急寻PlanB：英伟达改良版芯片已调试华为等国产

...，英伟达面向中国市场的改良版——HGX H20已与国内头部服务器厂商在进行适配测试，由于具体的性能差异和优化程度挂钩，目前还很难对其与高配版H800做性能对比，但是，预估HGX H20的8卡服务器仍高达百万级。英特尔则对Gaudi 2...……更多

2023-11-29 10:32:00华为,英伟,芯片,模型,国产,厂商

科技云报到：云服务的中场战事，从AI应用开始

...的核心能力基本停留在IaaS层面的“计算、存储和网络”服务器相关三大件领域，对于PaaS层的云服务能力相较落后于AWS等一众海外云厂商。但实际上，云厂商的价值则是要向PaaS平台发展的。“把IaaS、PaaS以及SaaS三者的优势拿出来...……更多

2024-10-09 17:05:00战事,报到,应用,服务,科技,模型

存储市场“供销两旺”原厂业绩好转，AI对存储应用市场提出要求

...近日在线上对记者分析说。进入2023年，除传统手机、PC和服务器市场外，ChatGPT开启的AI大模型浪潮、汽车智能化浪潮带来更多商业机会，这些应用场景对数据存储的容量、效率、流动性和安全性等方面提出了更高的需求。面对新...……更多

2024-03-23 16:31:00存储,市场,原厂,供销,业绩,应用

英特尔预计2024年正式上市Gaudi3，用于生成式AI模型

...伴和7家云服务商基于第五代至强处理器准备好了全新的服务器和云服务。”英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立称。自去年年底ChatGPT发布以来，大语言模型技术支持下的AIGC应用获得了极大的发展。而这...……更多

2023-12-15 22:53:00英特,英特尔,生成,模型,英特,英特尔

Sora这就落伍了？Meta“最强视频模型”不用DiT，用L

...行功率为 700W TDP，配备 80GB HBM3，采用 Meta 的 Grand Teton AI 服务器平台Baumgartner 和 Bowman，2022。在一台服务器内，有八个 GPU 通过 NVSwitch 进行均匀连接。服务器之间的 GPU 则通过 400Gbps RoCE R……更多

2024-10-08 09:51:00模型,不用,奇迹,视频,视频,模型

推理性能飙升1.5倍！微软疯狂下单GB200芯片提升其AI算

...展其AI计算能力。根据NVIDIA官方给出的数据，新一代GB200服务器系统在Llama 3.1 700亿参数大模型上的AI推理性能对比H200提高了足足1.5倍。此外，微软还计划在低温数据中心部署GB200服务器，以缓解冷却系统的潜在压力。其他云服务...……更多

2024-10-20 11:52:00微软,推理,芯片,性能,疯狂,微软

AI服务器缺货真相调查：两天涨价30万，连“味精大王”都入场

几乎是一夜之间，AI服务器价格在国内市场中飙升。智东西从一位服务器渠道销售人员处得知，搭载英伟达A800 GPU的热门AI服务器型号的价格已达140~150万元/台，比今年6月上涨超40%；搭载8颗英伟达H800 GPU的AI服务器价格上涨则更离...……更多

2023-10-21 17:43:00味精,缺货,大王,真相,调查,服务器

前商汤通用模型负责人打造3D大模型「Tripo」，3D生成迈

...战，实现通用且可扩展的解决方案。这对算法、数据量、服务器等有很高的要求一一不过这恰恰也是VAST团队的核心优势。VAST这一思路提高了生成模型的成功率和效率。目前，已经实现8秒钟生成带纹理3D网格模型，可以进入传统...……更多

2023-12-21 12:30:00商汤,模型,生成,负责人,项目,时代

阿里云挥出“三板斧”：免费也要挣到钱

...下来的模型“放置”在任何一个云厂商平台上，通过虚拟服务器跑起来。上述人士介绍，在第二种形式中，阿里云构建了百炼平台、灵积（DashScope）平台等，为用户提供模型训练、推理等所需的算力服务。这些平台不仅支持阿里...……更多

2024-06-28 18:08:00挥出,三板,三板斧,阿里,阿里,模型

联想与英伟达联合发布全新液冷AI服务器：可实现万亿参数AI模

...联想混合式AI全面优势集，推出ThinkSystem SC777 V4 Neptune，该服务器利用新的ThinkSystem N1380 Neptune，号称在紧凑的设计中实现万亿参数的AI模型。ThinkSystem N1380 Neptune垂直液冷机箱专为行业标准19英寸机架而设计，可……更多

2024-10-16 12:18:00英伟,模型,参数,全新,服务器,联合

英伟达特供芯片卖不动了？黄仁勋穿上东北花袄“示好”，中国大厂

...囤货，大批量购买A800、H800等英伟达芯片，目前已部署的服务器总量尚能支撑市场需求，故而对“减量不减价”的H20兴致缺缺。而前人工智能NLP企业首席科学家、千芯科技董事长陈巍进一步向时代财经记者透露，国内交易市场中...……更多

2024-01-30 16:23:00上东,大厂,英伟,中国,野心,芯片

有了它，断网也能“纵享丝滑”

...网络，如果网络不稳定，信号覆盖不到或者信号质量差，服务器处理能力不行的情况下，它的识别会非常不稳定。其次就是云端无法保证用户的隐私安全，存在泄漏风险。再就是云端的运行成本非常高，因为它要搭建，涉及到搭...……更多

2024-01-03 22:00:00云端,模型,场景,能力,成本,芯片

00后华裔小哥哈佛辍学组团挑战英伟达，史上最快AI芯片Soh

... ASIC。通过专门化，Sohu获得了前所未有的性能。一台8xSohu服务器每秒可以处理超过50万个Llama 70B token，等效于160块H100 GPU。Sohu仅支持Transformer推理，并支持当今所有的模型（Google、Meta、Microsoft、OpenAI、Anth……更多

2024-06-27 09:25:00小哥,英伟,哈佛,华裔,推理,芯片