• 我的订阅
  • 头条热搜
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
【新智元导读】是时候用CPU通用服务器跑千亿参数大模型了!马斯克19天建成由10万块H100串联的世界最大超算,已全力投入Grok 3的训练中。与此同时,外媒爆料称,OpenAI和微软联手打造的下一个超算集群,将由10万块GB200组成。...……更多
大厂混战AI大模型,云计算谁最行?
...算机性能、能耗、吞吐和延迟等方面要求较高,传统通用服务器的负载能力有限,无法承受高负载的人工智能应用,需要更适合深度学习训练场景的AI服务器方可完成。随着后续算力的持续增长,自然语言处理和图像、视频等AI...……更多
AI大厂硬刚价格战,中小模型夹缝求生存
...资源和成本也越相应增加。而承载超大参数量的背后则是服务器数量。据安信证券测算,目前ChatGPT每天所需的算力约50EFLOPs,所需服务器约1万台,若ChatGPT的用户量继续保持上涨,假设到24年底用户数量为5亿,则需要23万台服务...……更多
微软紧随英伟达发布芯片,老黄还不慌吗?
...大在于,建立了完整的自研芯片产业链,形成网络芯片、服务器芯片、AI芯片三条产品线。在AI芯片领域,亚马逊的自研产品就通用计算芯片、机器学习训练芯片、学习推理芯片等。满打满算,从2013年推出首款自研芯片Nitro1以来...……更多
重复造轮子的百模大战:两极热 中间空
...超过了100万倍。一位商汤员工表示,商汤上海临港AIDC的服务器机柜设计功耗10千瓦~25千瓦,最大可同时容纳4台左右英伟达A100服务器,但普通的服务器机柜普遍设计功耗以5千瓦居多,而单台A100服务器的功耗即高达4.5千瓦左右。...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...让腾讯具备了更强的“全局优化”能力。从自研的星星海服务器,到新一代HCC高性能计算集群,再到自研的星脉高速网络,腾讯已经为自己打造了一整套面向AIGC的高性能智算网络。据腾讯内部负责人介绍,目前腾讯云已经可支...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
...首先有自研全功能GPU,基于GPU做出计算加速卡,再组建成服务器,放进超融合一体机,然后将这样的4台机器整合到一个机柜里,形成一个小集群,小集群连成大集群,大集群的线性加速比高于91%。有了这样一个灵活组合的集群...……更多
围剿ChatGPT
...力发展不是一个新鲜的话题,但随着ChatGPT的崛起,基于服务器芯片的 AI 算力需求愈加强烈,在外界高需求、高关注、高压力之下,现有的服务器瞬时算力很难支撑高达千亿参数的大模型推理训练,大模型已经遭遇算力瓶颈。4月...……更多
ChatGPT走红背后:苦熬五年,三次AI路线迭代|行业观察
...要几百甚至几千张GPU卡的算力。这意味着在算力之外,当服务器节点众多,跨服务器通信需求大,网络带宽性能亦成为GPU集群瓶颈,高性能计算网络也随之成为一个话题。具体的数字更具说服力。有报道指出,Stability AI此前仅计...……更多
没有这些,别妄谈做 ChatGPT 了
...络经常需要几百 G 以上的 RDMA 带宽连接,而不是常见的云服务器几 G 到几十 G 的带宽。对于高可用并没有很强的要求,因为本身很多离线计算的任务,不涉及到容灾等问题。没有过度复杂的调度和机器级别的容灾。因为机器本身...……更多
ChatGPT中国变形记|深氪
...“清爽”。他以云服务做类比,在美国,可以直接按租用服务器收费,其他都不用管,正如ChatGPT可以直接按调用次数收费。但在中国,面对大企业和政府,技术公司得做全套服务、甚至是定制开发。这项技术与大用户产品结合...……更多
训练一次ChatGPT,“折寿”3000辆特斯拉
...降本增效已迫在眉睫。如果大模型普及,全球飞速运转的服务器,怕不会把地球烧了。既然大模型训练的成本中,电费占主要部分,那么究竟是哪些环节在耗电?又能如何优化?大模型是“电老虎”OpenAI曾在其《AIandCompute》分析...……更多
大模型厂商急寻PlanB:英伟达改良版芯片已调试 华为等国产算力供应不足
...,英伟达面向中国市场的改良版——HGX H20已与国内头部服务器厂商在进行适配测试,由于具体的性能差异和优化程度挂钩,目前还很难对其与高配版H800做性能对比,但是,预估HGX H20的8卡服务器仍高达百万级。英特尔则对Gaudi 2...……更多
亏了13年的阿里云刚赚钱,怎么就被逼着五折大促销了?
...的需要,自建云都是一条 “ 不归路 ” 。 一旦你用上云服务器,新的问题就出现了。云计算的需求是由 “ 最高峰时的算力需要 ” 决定的,这就是所谓的弹性。但在平时,企业用到的算力可能是峰值的 1/3 甚至更少。这你不能...……更多
算力隐伤
...让“算力更普惠”的智算平台,硬件厂商则乘势加快了AI服务器、AI芯片、存储的国产替代进程。算力突围战,再次打响。01、奇点之路,算力为基在2023财年Q1财报会上,扎克伯格称“生成式AI将触及Meta所有产品”,这已是全球第...……更多
科技云报到:云服务的中场战事,从AI应用开始
...的核心能力基本停留在IaaS层面的“计算、存储和网络”服务器相关三大件领域,对于PaaS层的云服务能力相较落后于AWS等一众海外云厂商。但实际上,云厂商的价值则是要向PaaS平台发展的。“把IaaS、PaaS以及SaaS三者的优势拿出来...……更多
存储市场“供销两旺”原厂业绩好转,AI对存储应用市场提出要求
...近日在线上对记者分析说。进入2023年,除传统手机、PC和服务器市场外,ChatGPT开启的AI大模型浪潮、汽车智能化浪潮带来更多商业机会,这些应用场景对数据存储的容量、效率、流动性和安全性等方面提出了更高的需求。面对新...……更多
...我们使用一些内存优化的方案,将模型参数和梯度存储在服务器的磁盘内存中,这种情况下训练速度也会非常慢。让我们来举一个简单的例子,暂时不考虑GPT-3.5,假设我们使用一个非常小的模型,只有2000万个参数,这是一个非...……更多
英特尔预计2024年正式上市Gaudi3,用于生成式AI模型
...伴和7家云服务商基于第五代至强处理器准备好了全新的服务器和云服务。”英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立称。自去年年底ChatGPT发布以来,大语言模型技术支持下的AIGC应用获得了极大的发展。而这...……更多
MOSS核心成员:我们低估了ChatGPT影响力
...公布的对话式大型语言模型,热情的用户涌入一度导致其服务器被挤崩。21日晚,第一财经连麦学界、法律界大V,共同探讨了ChatGPT的应用、误读以及其牵涉的法律风险和商业伦理问题。复旦大学计算机科学技术学院教授张奇参...……更多
Sora这就落伍了?Meta“最强视频模型”不用DiT,用Llama大力出奇迹了
...行功率为 700W TDP,配备 80GB HBM3,采用 Meta 的 Grand Teton AI 服务器平台Baumgartner 和 Bowman,2022。在一台服务器内,有八个 GPU 通过 NVSwitch 进行均匀连接。服务器之间的 GPU 则通过 400Gbps RoCE R……更多
推理性能飙升1.5倍!微软疯狂下单GB200芯片提升其AI算力
...展其AI计算能力。根据NVIDIA官方给出的数据,新一代GB200服务器系统在Llama 3.1 700亿参数大模型上的AI推理性能对比H200提高了足足1.5倍。此外,微软还计划在低温数据中心部署GB200服务器,以缓解冷却系统的潜在压力。其他云服务...……更多
大模型激战:能否再造20年前互联网盛景
...月ChatGPT对相关概念股股价的拉动,芯片、光模块、PCB、服务器年初至今已各涨65%、146%、45%、62%。巨头混战大模型,能不能开启下一轮技术革命的热潮?谁究竟能脱颖而出?02别低估了大模型的门槛今年2月份ChatGPT-4问世后...……更多
算力逻辑修复!各大厂商接入DS催化港股AI基建概念 李彦宏称仍应持续投入
...地部署,还是云端接入使用DeepSeek,都需要一定的算力和服务器资源提供硬件支持。在阿联酋迪拜举办的World Governments Summit 2025峰会上,百度创始人李彦宏提及DeepSeek时也强调称,尽管技术进步、成本降低,但仍需对芯片、数据中...……更多
中国AI大模型鏖战 上演科技罗生门
...月ChatGPT对相关概念股股价的拉动,芯片、光模块、PCB、服务器年初至今已各涨65%、146%、45%、62%。但大模型的需求真就如此之大么?产业链的需求有没有虚火么?这个答案显而易见。虚火旺盛,泡沫横生,不少投机者也在其中浑...……更多
AI服务器缺货真相调查:两天涨价30万,连“味精大王”都入场了
几乎是一夜之间,AI服务器价格在国内市场中飙升。智东西从一位服务器渠道销售人员处得知,搭载英伟达A800 GPU的热门AI服务器型号的价格已达140~150万元/台,比今年6月上涨超40%;搭载8颗英伟达H800 GPU的AI服务器价格上涨则更离...……更多
前商汤通用模型负责人打造3D大模型「Tripo」,3D生成迈入「秒级」时代 | 早期项目
...战,实现通用且可扩展的解决方案。这对算法、数据量、服务器等有很高的要求一一不过这恰恰也是VAST团队的核心优势。VAST这一思路提高了生成模型的成功率和效率。目前,已经实现8秒钟生成带纹理3D网格模型,可以进入传统...……更多
阿里云挥出“三板斧”:免费也要挣到钱
...下来的模型“放置”在任何一个云厂商平台上,通过虚拟服务器跑起来。上述人士介绍,在第二种形式中,阿里云构建了百炼平台、灵积(DashScope)平台等,为用户提供模型训练、推理等所需的算力服务。这些平台不仅支持阿里...……更多
复旦MOSS大模型开源了!Github和Hugging Face同时上线
...SS的参数量比ChatGPT小了一个量级,大家还是蜂拥而上,把服务器都给挤爆了。而发布没过一周,复旦大学教授邱锡鹏就在演讲中提出,如果优化顺利,计划在三月底开源MOSS。因为在他看来:人们之所以很容易有“卡脖子”问题...……更多
联想与英伟达联合发布全新液冷AI服务器:可实现万亿参数AI模型
...联想混合式AI全面优势集,推出ThinkSystem SC777 V4 Neptune,该服务器利用新的ThinkSystem N1380 Neptune,号称在紧凑的设计中实现万亿参数的AI模型。ThinkSystem N1380 Neptune垂直液冷机箱专为行业标准19英寸机架而设计,可……更多
更多关于科技的资讯:
潍坊市坊子区举行食品产业链路演对接会,推动资源共享,促进“互配互采”—— 政企同心绘就食品产业“新蓝图”
鲁网3月8日讯“这场对接会真是一场及时雨!”3月7日,刚刚走出对接会会场,山东同源水业有限公司负责人徐源就感慨道。据了解
2025-03-08 16:39:00
厦门中芯云大数据研究院发布HUB AI健康助手,开启智能健康新时代
2025年2月22日,厦门中芯云大数据研究院今日宣布,其自主研发的HUBAI健康助手正式发布,推出手机版和电视版两款产品
2025-03-08 17:08:00
全国人大代表尹双凤:完善科技评价标准化机制,激发创新驱动力
本文转自:人民网-湖南频道全国人大代表尹双凤。受访单位供图人民网长沙3月8日电 (记者林洛頫)在科技创新成为全球竞争焦点的当下
2025-03-08 17:44:00
本文转自:人民日报本报记者 耿 磊 葛 燊 杨翘楚3月8日上午,十四届全国人大三次会议第二场“代表通道”在人民大会堂举行
2025-03-09 06:25:00
本文转自:人民日报本报记者  蒋雨师作为一名参与全国两会报道的摄影记者,以往我主要根据个人经验选择拍摄点位和角度,这次人工智能(AI)助手成了我的报道“搭子”
2025-03-09 06:28:00
本文转自:人民日报中兴通讯高级副总裁  苗伟代表近年来,中兴通讯在5G、云计算、大数据、人工智能等核心技术领域持续创新
2025-03-09 06:29:00
饿了么定制升级“助老e餐”服务  政企合作共建数字化未来社区
本文转自:人民日报“小饭碗”关系着老龄事业的“大民生”。对很多老人而言,解决好每天的吃饭问题,居家养老的安全感和幸福感就能大幅提升
2025-03-09 06:30:00
本文转自:人民日报马新强代表谈科技自立自强——创新是一场没有终点的长跑(现场·代表通道)本报记者 耿 磊43秒,能做什么
2025-03-09 06:32:00
时速近200公里!小米SU7 Ultra深夜狂飙严重超速 官方通报:车主已抓获
快科技3月9日消息,日前,山东潍坊公安就一起“司机驾驶小米SU7 Ultra飙车”事件发布情况通报。根据潍坊交警抖音账号公布的视频画面显示
2025-03-09 06:46:00
你会扶吗!00后小伙遇大爷摔倒毫不犹豫扶:觉得讹人的应该挺少的
3月9日消息,一位00后小伙的善举引起了网友的热议,不少人纷纷为他点赞。近日,山东潍坊00后小伙张先生偶遇大爷摔倒。当时大爷骑的三轮倒在马路边上
2025-03-09 06:46:00
专家称0补课、0月考孩子成绩都是A:国内教育应停止“掐尖”急功近利
3月9日消息,全国人大代表、重庆市九龙坡区谢家湾学校党委书记刘希娅近日公开表示,学校0补课0月考,9成孩子成绩是A。刘希娅建议革新人才培养机制
2025-03-09 06:46:00
小米终结特斯拉销量神话
外媒惊呼,特斯拉神话已经被小米终结了。在中国市场,特斯拉Model 3的销量已经被小米SU7超越。连外国网友也不由惊叹小米SU7的实力
2025-03-08 13:45:00
“实习生也月入过万”,这一行业严重缺人
作者: 张旦珺市场对寻求AI人才的渴望,到了按图索骥的程度。晚点latepost曾在报道中记录过这样一个细节:当一位投资人循着AI论文上的名字一个个去拜访时
2025-03-09 03:32:00
英特尔酷睿Ultra 9 285H性能实测:50W超越前代90W性能
年初英特尔正式发布了英特尔酷睿Ultra 200H标压处理器,该系列对应上一代酷睿Ultra 100H系列处理器,最高规格为16核CPU+8核GPU的配置
2025-03-08 22:45:00
直屏回归!小米16 Pro采用全新设计
近期,知名数码博主数码闲聊站带来了一则消息:即将在10月左右发布的迭代旗舰手机,将普遍转向直屏设计,并引入LIPO这一前沿技术
2025-03-08 23:15:00