• 我的订阅
  • 头条热搜
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
【新智元导读】是时候用CPU通用服务器跑千亿参数大模型了!马斯克19天建成由10万块H100串联的世界最大超算,已全力投入Grok 3的训练中。与此同时,外媒爆料称,OpenAI和微软联手打造的下一个超算集群,将由10万块GB200组成。...……更多
大厂混战AI大模型,云计算谁最行?
...算机性能、能耗、吞吐和延迟等方面要求较高,传统通用服务器的负载能力有限,无法承受高负载的人工智能应用,需要更适合深度学习训练场景的AI服务器方可完成。随着后续算力的持续增长,自然语言处理和图像、视频等AI...……更多
AI大厂硬刚价格战,中小模型夹缝求生存
...资源和成本也越相应增加。而承载超大参数量的背后则是服务器数量。据安信证券测算,目前ChatGPT每天所需的算力约50EFLOPs,所需服务器约1万台,若ChatGPT的用户量继续保持上涨,假设到24年底用户数量为5亿,则需要23万台服务...……更多
重复造轮子的百模大战:两极热 中间空
...超过了100万倍。一位商汤员工表示,商汤上海临港AIDC的服务器机柜设计功耗10千瓦~25千瓦,最大可同时容纳4台左右英伟达A100服务器,但普通的服务器机柜普遍设计功耗以5千瓦居多,而单台A100服务器的功耗即高达4.5千瓦左右。...……更多
微软紧随英伟达发布芯片,老黄还不慌吗?
...大在于,建立了完整的自研芯片产业链,形成网络芯片、服务器芯片、AI芯片三条产品线。在AI芯片领域,亚马逊的自研产品就通用计算芯片、机器学习训练芯片、学习推理芯片等。满打满算,从2013年推出首款自研芯片Nitro1以来...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...让腾讯具备了更强的“全局优化”能力。从自研的星星海服务器,到新一代HCC高性能计算集群,再到自研的星脉高速网络,腾讯已经为自己打造了一整套面向AIGC的高性能智算网络。据腾讯内部负责人介绍,目前腾讯云已经可支...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
...首先有自研全功能GPU,基于GPU做出计算加速卡,再组建成服务器,放进超融合一体机,然后将这样的4台机器整合到一个机柜里,形成一个小集群,小集群连成大集群,大集群的线性加速比高于91%。有了这样一个灵活组合的集群...……更多
围剿ChatGPT
...力发展不是一个新鲜的话题,但随着ChatGPT的崛起,基于服务器芯片的 AI 算力需求愈加强烈,在外界高需求、高关注、高压力之下,现有的服务器瞬时算力很难支撑高达千亿参数的大模型推理训练,大模型已经遭遇算力瓶颈。4月...……更多
ChatGPT走红背后:苦熬五年,三次AI路线迭代|行业观察
...要几百甚至几千张GPU卡的算力。这意味着在算力之外,当服务器节点众多,跨服务器通信需求大,网络带宽性能亦成为GPU集群瓶颈,高性能计算网络也随之成为一个话题。具体的数字更具说服力。有报道指出,Stability AI此前仅计...……更多
ChatGPT中国变形记|深氪
...“清爽”。他以云服务做类比,在美国,可以直接按租用服务器收费,其他都不用管,正如ChatGPT可以直接按调用次数收费。但在中国,面对大企业和政府,技术公司得做全套服务、甚至是定制开发。这项技术与大用户产品结合...……更多
没有这些,别妄谈做 ChatGPT 了
...络经常需要几百 G 以上的 RDMA 带宽连接,而不是常见的云服务器几 G 到几十 G 的带宽。对于高可用并没有很强的要求,因为本身很多离线计算的任务,不涉及到容灾等问题。没有过度复杂的调度和机器级别的容灾。因为机器本身...……更多
训练一次ChatGPT,“折寿”3000辆特斯拉
...降本增效已迫在眉睫。如果大模型普及,全球飞速运转的服务器,怕不会把地球烧了。既然大模型训练的成本中,电费占主要部分,那么究竟是哪些环节在耗电?又能如何优化?大模型是“电老虎”OpenAI曾在其《AIandCompute》分析...……更多
大模型厂商急寻PlanB:英伟达改良版芯片已调试 华为等国产算力供应不足
...,英伟达面向中国市场的改良版——HGX H20已与国内头部服务器厂商在进行适配测试,由于具体的性能差异和优化程度挂钩,目前还很难对其与高配版H800做性能对比,但是,预估HGX H20的8卡服务器仍高达百万级。英特尔则对Gaudi 2...……更多
亏了13年的阿里云刚赚钱,怎么就被逼着五折大促销了?
...的需要,自建云都是一条 “ 不归路 ” 。 一旦你用上云服务器,新的问题就出现了。云计算的需求是由 “ 最高峰时的算力需要 ” 决定的,这就是所谓的弹性。但在平时,企业用到的算力可能是峰值的 1/3 甚至更少。这你不能...……更多
算力隐伤
...让“算力更普惠”的智算平台,硬件厂商则乘势加快了AI服务器、AI芯片、存储的国产替代进程。算力突围战,再次打响。01、奇点之路,算力为基在2023财年Q1财报会上,扎克伯格称“生成式AI将触及Meta所有产品”,这已是全球第...……更多
科技云报到:云服务的中场战事,从AI应用开始
...的核心能力基本停留在IaaS层面的“计算、存储和网络”服务器相关三大件领域,对于PaaS层的云服务能力相较落后于AWS等一众海外云厂商。但实际上,云厂商的价值则是要向PaaS平台发展的。“把IaaS、PaaS以及SaaS三者的优势拿出来...……更多
存储市场“供销两旺”原厂业绩好转,AI对存储应用市场提出要求
...近日在线上对记者分析说。进入2023年,除传统手机、PC和服务器市场外,ChatGPT开启的AI大模型浪潮、汽车智能化浪潮带来更多商业机会,这些应用场景对数据存储的容量、效率、流动性和安全性等方面提出了更高的需求。面对新...……更多
...我们使用一些内存优化的方案,将模型参数和梯度存储在服务器的磁盘内存中,这种情况下训练速度也会非常慢。让我们来举一个简单的例子,暂时不考虑GPT-3.5,假设我们使用一个非常小的模型,只有2000万个参数,这是一个非...……更多
英特尔预计2024年正式上市Gaudi3,用于生成式AI模型
...伴和7家云服务商基于第五代至强处理器准备好了全新的服务器和云服务。”英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立称。自去年年底ChatGPT发布以来,大语言模型技术支持下的AIGC应用获得了极大的发展。而这...……更多
MOSS核心成员:我们低估了ChatGPT影响力
...公布的对话式大型语言模型,热情的用户涌入一度导致其服务器被挤崩。21日晚,第一财经连麦学界、法律界大V,共同探讨了ChatGPT的应用、误读以及其牵涉的法律风险和商业伦理问题。复旦大学计算机科学技术学院教授张奇参...……更多
Sora这就落伍了?Meta“最强视频模型”不用DiT,用Llama大力出奇迹了
...行功率为 700W TDP,配备 80GB HBM3,采用 Meta 的 Grand Teton AI 服务器平台Baumgartner 和 Bowman,2022。在一台服务器内,有八个 GPU 通过 NVSwitch 进行均匀连接。服务器之间的 GPU 则通过 400Gbps RoCE R……更多
推理性能飙升1.5倍!微软疯狂下单GB200芯片提升其AI算力
...展其AI计算能力。根据NVIDIA官方给出的数据,新一代GB200服务器系统在Llama 3.1 700亿参数大模型上的AI推理性能对比H200提高了足足1.5倍。此外,微软还计划在低温数据中心部署GB200服务器,以缓解冷却系统的潜在压力。其他云服务...……更多
大模型激战:能否再造20年前互联网盛景
...月ChatGPT对相关概念股股价的拉动,芯片、光模块、PCB、服务器年初至今已各涨65%、146%、45%、62%。巨头混战大模型,能不能开启下一轮技术革命的热潮?谁究竟能脱颖而出?02别低估了大模型的门槛今年2月份ChatGPT-4问世后...……更多
中国AI大模型鏖战 上演科技罗生门
...月ChatGPT对相关概念股股价的拉动,芯片、光模块、PCB、服务器年初至今已各涨65%、146%、45%、62%。但大模型的需求真就如此之大么?产业链的需求有没有虚火么?这个答案显而易见。虚火旺盛,泡沫横生,不少投机者也在其中浑...……更多
AI服务器缺货真相调查:两天涨价30万,连“味精大王”都入场了
几乎是一夜之间,AI服务器价格在国内市场中飙升。智东西从一位服务器渠道销售人员处得知,搭载英伟达A800 GPU的热门AI服务器型号的价格已达140~150万元/台,比今年6月上涨超40%;搭载8颗英伟达H800 GPU的AI服务器价格上涨则更离...……更多
前商汤通用模型负责人打造3D大模型「Tripo」,3D生成迈入「秒级」时代 | 早期项目
...战,实现通用且可扩展的解决方案。这对算法、数据量、服务器等有很高的要求一一不过这恰恰也是VAST团队的核心优势。VAST这一思路提高了生成模型的成功率和效率。目前,已经实现8秒钟生成带纹理3D网格模型,可以进入传统...……更多
阿里云挥出“三板斧”:免费也要挣到钱
...下来的模型“放置”在任何一个云厂商平台上,通过虚拟服务器跑起来。上述人士介绍,在第二种形式中,阿里云构建了百炼平台、灵积(DashScope)平台等,为用户提供模型训练、推理等所需的算力服务。这些平台不仅支持阿里...……更多
复旦MOSS大模型开源了!Github和Hugging Face同时上线
...SS的参数量比ChatGPT小了一个量级,大家还是蜂拥而上,把服务器都给挤爆了。而发布没过一周,复旦大学教授邱锡鹏就在演讲中提出,如果优化顺利,计划在三月底开源MOSS。因为在他看来:人们之所以很容易有“卡脖子”问题...……更多
联想与英伟达联合发布全新液冷AI服务器:可实现万亿参数AI模型
...联想混合式AI全面优势集,推出ThinkSystem SC777 V4 Neptune,该服务器利用新的ThinkSystem N1380 Neptune,号称在紧凑的设计中实现万亿参数的AI模型。ThinkSystem N1380 Neptune垂直液冷机箱专为行业标准19英寸机架而设计,可……更多
英伟达特供芯片卖不动了?黄仁勋穿上东北花袄“示好”,中国大厂难掩AI野心
...囤货,大批量购买A800、H800等英伟达芯片,目前已部署的服务器总量尚能支撑市场需求,故而对“减量不减价”的H20兴致缺缺。而前人工智能NLP企业首席科学家、千芯科技董事长陈巍进一步向时代财经记者透露,国内交易市场中...……更多
更多关于科技的资讯:
对阵日本的1380门票炒到8000:国足世界杯出线概率37.9%
11月6日消息,18强赛结束第五轮比赛,数据博主We Global Football更新了亚洲各队出线概率。国足直接晋级概率为2
2024-11-16 21:21:00
苹果iPhone 16刚买一个月就自燃了 女生:发誓没用磁吸充电器
快科技11月16日消息,一名女生在社交平台上称,她11月6日买的iPhone 16,在看综艺的时候突然自燃,目前已经联系商家及平台
2024-11-16 21:51:00
苹果官方没宣传:M4 MacBook Pro首发量子点显示技术
快科技11月16日消息,显示专家Ross Young在社交平台上表示,最新的M4 MacBook Pro使用量子点(QD)薄膜
2024-11-16 22:21:00
队史首个连冠!成都AG超玩会夺得2024KPL年度总决赛冠军
快科技11月16日消息,成都AG超玩会夺得2024KPL年总决赛总冠军!在今晚的比赛中,成都AG超玩会以4:2比分战胜重庆狼队
2024-11-16 22:21:00
智能门锁“咬人”事件频发 产品到底该如何购买
随着智能家居的普及,智能门锁因其便捷性和安全性受到了越来越多家庭的青睐。然而近年来频繁发生的智能门锁“咬人”事件,却让消费者开始对这种高科技产品产生了疑虑
2024-11-16 22:21:00
卢伟冰:Redmi K80系列全面满足销冠的一系列诉求
快科技11月16日消息,卢伟冰发微博表示,他问了销冠们一个问题,你们对K80有哪些期待?他们提了一系列的诉求,这次K80全部命中
2024-11-16 22:51:00
印尼火山最高级别警戒!航班全部取消 千万别去
快科技11月16日消息,勒沃托比火山,位于印度尼西亚东努沙登加拉省的东弗洛勒斯县,自11月3日起已多次喷发。当地时间11月12日上午8时48分
2024-11-16 22:51:00
2024健瑞儿亲子嘉年华万宁站火热进行中 宝爸宝妈囤货忙
南海网11月16日消息(记者 潘頔)11月16日,“趣”万宁 大咖驾到2024健瑞儿亲子嘉年华万宁站在万宁市人民公园继续进行
2024-11-16 23:09:00
三星G61SD显示器上手:大师级色彩还原 一眼可见
对于追求画面色彩表现的竞技玩家来说,OLED显示器是一个绕不开的话题,尤其是由三星领头的QD-OLED面板更是市面上独一无二的选择
2024-11-16 23:21:00
肯德基多门店下架预制产品 工作人员:可能是因为销量不太好
11月16日消息,据媒体报道,近日,肯德基全国多地门店下架“自在厨房”冷冻预制类产品,引起关注。对此,广州一肯德基门店工作人员表示
2024-11-16 23:21:00
oppofindx8ultra预计2025年第一季度发布
10月,OPPO发布了OPPOFindX8和OPPOFindX8Pro两款年度旗舰机型,全球首批搭载了联发科天玑9400旗舰级处理器
2024-11-17 00:00:00
明年将有多家手机厂商推出“S”型号的小迭代机型
11月16日,CNMO注意到,知名爆料人士数码闲聊站发文透露,明年将有多家手机厂商推出“S”型号的小迭代机型,中端线和旗舰线都有
2024-11-17 00:01:00
广汽埃安展台人气爆棚,为未来发展注入强大动力
11月15日,第二十二届广州国际汽车展览会(以下简称“广州车展”)在中国进出口商品交易会展馆盛大开幕。作为2024年最后一场重磅国际车展
2024-11-17 00:01:00
深蓝汽车deepalos2.3发布,带来四大核心升级
11月16日,CNMO注意到,据深蓝汽车官方消息,深蓝汽车DEEPALOS2.3正式发布,带来了四大核心升级和超三十项的体验优化
2024-11-17 00:03:00
六款子品牌新机续航系统曝光
11月16日,CNMO注意到,知名爆料人士数码闲聊站一次性放出了六款各家子品牌新机的续航系统信息。据爆料,这六款新机的电池容量和充电功率分别为
2024-11-17 00:04:00