• 我的订阅
  • 头条热搜
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
【新智元导读】是时候用CPU通用服务器跑千亿参数大模型了!马斯克19天建成由10万块H100串联的世界最大超算,已全力投入Grok 3的训练中。与此同时,外媒爆料称,OpenAI和微软联手打造的下一个超算集群,将由10万块GB200组成。...……更多
大厂混战AI大模型,云计算谁最行?
...算机性能、能耗、吞吐和延迟等方面要求较高,传统通用服务器的负载能力有限,无法承受高负载的人工智能应用,需要更适合深度学习训练场景的AI服务器方可完成。随着后续算力的持续增长,自然语言处理和图像、视频等AI...……更多
AI大厂硬刚价格战,中小模型夹缝求生存
...资源和成本也越相应增加。而承载超大参数量的背后则是服务器数量。据安信证券测算,目前ChatGPT每天所需的算力约50EFLOPs,所需服务器约1万台,若ChatGPT的用户量继续保持上涨,假设到24年底用户数量为5亿,则需要23万台服务...……更多
重复造轮子的百模大战:两极热 中间空
...超过了100万倍。一位商汤员工表示,商汤上海临港AIDC的服务器机柜设计功耗10千瓦~25千瓦,最大可同时容纳4台左右英伟达A100服务器,但普通的服务器机柜普遍设计功耗以5千瓦居多,而单台A100服务器的功耗即高达4.5千瓦左右。...……更多
微软紧随英伟达发布芯片,老黄还不慌吗?
...大在于,建立了完整的自研芯片产业链,形成网络芯片、服务器芯片、AI芯片三条产品线。在AI芯片领域,亚马逊的自研产品就通用计算芯片、机器学习训练芯片、学习推理芯片等。满打满算,从2013年推出首款自研芯片Nitro1以来...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...让腾讯具备了更强的“全局优化”能力。从自研的星星海服务器,到新一代HCC高性能计算集群,再到自研的星脉高速网络,腾讯已经为自己打造了一整套面向AIGC的高性能智算网络。据腾讯内部负责人介绍,目前腾讯云已经可支...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
...首先有自研全功能GPU,基于GPU做出计算加速卡,再组建成服务器,放进超融合一体机,然后将这样的4台机器整合到一个机柜里,形成一个小集群,小集群连成大集群,大集群的线性加速比高于91%。有了这样一个灵活组合的集群...……更多
围剿ChatGPT
...力发展不是一个新鲜的话题,但随着ChatGPT的崛起,基于服务器芯片的 AI 算力需求愈加强烈,在外界高需求、高关注、高压力之下,现有的服务器瞬时算力很难支撑高达千亿参数的大模型推理训练,大模型已经遭遇算力瓶颈。4月...……更多
ChatGPT走红背后:苦熬五年,三次AI路线迭代|行业观察
...要几百甚至几千张GPU卡的算力。这意味着在算力之外,当服务器节点众多,跨服务器通信需求大,网络带宽性能亦成为GPU集群瓶颈,高性能计算网络也随之成为一个话题。具体的数字更具说服力。有报道指出,Stability AI此前仅计...……更多
ChatGPT中国变形记|深氪
...“清爽”。他以云服务做类比,在美国,可以直接按租用服务器收费,其他都不用管,正如ChatGPT可以直接按调用次数收费。但在中国,面对大企业和政府,技术公司得做全套服务、甚至是定制开发。这项技术与大用户产品结合...……更多
没有这些,别妄谈做 ChatGPT 了
...络经常需要几百 G 以上的 RDMA 带宽连接,而不是常见的云服务器几 G 到几十 G 的带宽。对于高可用并没有很强的要求,因为本身很多离线计算的任务,不涉及到容灾等问题。没有过度复杂的调度和机器级别的容灾。因为机器本身...……更多
训练一次ChatGPT,“折寿”3000辆特斯拉
...降本增效已迫在眉睫。如果大模型普及,全球飞速运转的服务器,怕不会把地球烧了。既然大模型训练的成本中,电费占主要部分,那么究竟是哪些环节在耗电?又能如何优化?大模型是“电老虎”OpenAI曾在其《AIandCompute》分析...……更多
大模型厂商急寻PlanB:英伟达改良版芯片已调试 华为等国产算力供应不足
...,英伟达面向中国市场的改良版——HGX H20已与国内头部服务器厂商在进行适配测试,由于具体的性能差异和优化程度挂钩,目前还很难对其与高配版H800做性能对比,但是,预估HGX H20的8卡服务器仍高达百万级。英特尔则对Gaudi 2...……更多
亏了13年的阿里云刚赚钱,怎么就被逼着五折大促销了?
...的需要,自建云都是一条 “ 不归路 ” 。 一旦你用上云服务器,新的问题就出现了。云计算的需求是由 “ 最高峰时的算力需要 ” 决定的,这就是所谓的弹性。但在平时,企业用到的算力可能是峰值的 1/3 甚至更少。这你不能...……更多
算力隐伤
...让“算力更普惠”的智算平台,硬件厂商则乘势加快了AI服务器、AI芯片、存储的国产替代进程。算力突围战,再次打响。01、奇点之路,算力为基在2023财年Q1财报会上,扎克伯格称“生成式AI将触及Meta所有产品”,这已是全球第...……更多
存储市场“供销两旺”原厂业绩好转,AI对存储应用市场提出要求
...近日在线上对记者分析说。进入2023年,除传统手机、PC和服务器市场外,ChatGPT开启的AI大模型浪潮、汽车智能化浪潮带来更多商业机会,这些应用场景对数据存储的容量、效率、流动性和安全性等方面提出了更高的需求。面对新...……更多
英特尔预计2024年正式上市Gaudi3,用于生成式AI模型
...伴和7家云服务商基于第五代至强处理器准备好了全新的服务器和云服务。”英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立称。自去年年底ChatGPT发布以来,大语言模型技术支持下的AIGC应用获得了极大的发展。而这...……更多
MOSS核心成员:我们低估了ChatGPT影响力
...公布的对话式大型语言模型,热情的用户涌入一度导致其服务器被挤崩。21日晚,第一财经连麦学界、法律界大V,共同探讨了ChatGPT的应用、误读以及其牵涉的法律风险和商业伦理问题。复旦大学计算机科学技术学院教授张奇参...……更多
大模型激战:能否再造20年前互联网盛景
...月ChatGPT对相关概念股股价的拉动,芯片、光模块、PCB、服务器年初至今已各涨65%、146%、45%、62%。巨头混战大模型,能不能开启下一轮技术革命的热潮?谁究竟能脱颖而出?02别低估了大模型的门槛今年2月份ChatGPT-4问世后...……更多
中国AI大模型鏖战 上演科技罗生门
...月ChatGPT对相关概念股股价的拉动,芯片、光模块、PCB、服务器年初至今已各涨65%、146%、45%、62%。但大模型的需求真就如此之大么?产业链的需求有没有虚火么?这个答案显而易见。虚火旺盛,泡沫横生,不少投机者也在其中浑...……更多
AI服务器缺货真相调查:两天涨价30万,连“味精大王”都入场了
几乎是一夜之间,AI服务器价格在国内市场中飙升。智东西从一位服务器渠道销售人员处得知,搭载英伟达A800 GPU的热门AI服务器型号的价格已达140~150万元/台,比今年6月上涨超40%;搭载8颗英伟达H800 GPU的AI服务器价格上涨则更离...……更多
前商汤通用模型负责人打造3D大模型「Tripo」,3D生成迈入「秒级」时代 | 早期项目
...战,实现通用且可扩展的解决方案。这对算法、数据量、服务器等有很高的要求一一不过这恰恰也是VAST团队的核心优势。VAST这一思路提高了生成模型的成功率和效率。目前,已经实现8秒钟生成带纹理3D网格模型,可以进入传统...……更多
阿里云挥出“三板斧”:免费也要挣到钱
...下来的模型“放置”在任何一个云厂商平台上,通过虚拟服务器跑起来。上述人士介绍,在第二种形式中,阿里云构建了百炼平台、灵积(DashScope)平台等,为用户提供模型训练、推理等所需的算力服务。这些平台不仅支持阿里...……更多
复旦MOSS大模型开源了!Github和Hugging Face同时上线
...SS的参数量比ChatGPT小了一个量级,大家还是蜂拥而上,把服务器都给挤爆了。而发布没过一周,复旦大学教授邱锡鹏就在演讲中提出,如果优化顺利,计划在三月底开源MOSS。因为在他看来:人们之所以很容易有“卡脖子”问题...……更多
英伟达特供芯片卖不动了?黄仁勋穿上东北花袄“示好”,中国大厂难掩AI野心
...囤货,大批量购买A800、H800等英伟达芯片,目前已部署的服务器总量尚能支撑市场需求,故而对“减量不减价”的H20兴致缺缺。而前人工智能NLP企业首席科学家、千芯科技董事长陈巍进一步向时代财经记者透露,国内交易市场中...……更多
GPT-4撞上文心一言,百度压力骤增:多模态和中文能力受关注,或多种方式落地
...言顺利上线,百度阳泉智算中心专门为其搭建了GPU集成的服务器中心,该地运维人员也在紧急进行压力测试。据了解,百度阳泉智算中心采用的也是英伟达芯片,而百度也在推动芯片研发,其量产的7纳米昆仑芯2代在FP16精度下达...……更多
有了它,断网也能“纵享丝滑”
...网络,如果网络不稳定,信号覆盖不到或者信号质量差,服务器处理能力不行的情况下,它的识别会非常不稳定。其次就是云端无法保证用户的隐私安全,存在泄漏风险。再就是云端的运行成本非常高,因为它要搭建,涉及到搭...……更多
00后华裔小哥哈佛辍学组团挑战英伟达,史上最快AI芯片Sohu推理性能超H100二十倍!
... ASIC。通过专门化,Sohu获得了前所未有的性能。一台8xSohu服务器每秒可以处理超过50万个Llama 70B token,等效于160块H100 GPU。Sohu仅支持Transformer推理,并支持当今所有的模型(Google、Meta、Microsoft、OpenAI、Anth……更多
AI手机没有独家大模型供应商
...是一项长期消耗成本、且暂时还无法停下的趋势,无论是服务器消耗的电力、相关研发等都需要持续的投入。算法交易公司Deep Trading就曾指出,ChatGPT4以1.8亿用户基数和每人100Ktoken/天计算,每日成本就高达88.2万美元。此前vivo副...……更多
够21万人喝一辈子的水 还不够谷歌服务器用7个月
...水?今天就来跟大家聊聊,那些互联网巨头们都是怎么给服务器散热的。有什么办法,能把杭州西湖的水给用完?这是杭州西湖,三面环山,面积约6.39平方千米,南北长约3.2千米,东西宽约2.8千米,水体容量约为1429万立方米。...……更多
更多关于科技的资讯:
AI驱动矿业革新,迎接可持续未来
2024年9月22日,矿业与科技行业的精英们齐聚中国杭州,共同见证KoBold科宝全球淘金计划的正式启动及其创新型挖矿淘金平台KoBoldApp的发布
2024-09-23 09:58:00
截胡Meta!Snap发了款“只租不卖”的AR眼镜,却让我们离消费级AR更近了
可穿戴智能设备的红海里,有人在VR赛道挤破头,也有人希望在AR领域打出一番天地。就在外界传言Meta下周即将推出首款AR眼镜Orion时
2024-09-23 10:00:00
Meta联合开发机器人AI模型,任务成功率达90%
在机器人技术领域,让机器人在从未见过的环境中执行任务一直是一个棘手的问题。一般来说,研究人员需要针对每个新环境对机器人进行额外的训练
2024-09-23 10:02:00
吴裕泰年度终端销售破10亿元,137周年再造自有品牌产品矩阵
文|李振兴2024年9月20日,中华老字号吴裕泰举办了“茶韵百年、芳华千载”主题庆典活动和自有品牌产品发布会,正式对外推出自有品牌产品矩阵
2024-09-23 10:05:00
当“金九银十”遇到“以旧换新”,四季度销售额有望直涨三四成?
国庆黄金周即将来临,在“金九银十”的传统家装旺季,叠加全国各地掀起的“家居家装家电以旧换新”补贴热潮,众多家居企业纷纷抢抓机遇
2024-09-23 10:06:00
江苏中塑TPE|如何从TPE包胶工艺来分析包胶效果?
从TPE包胶工艺的理论模型来分析,实现接合(cohesion)包胶效果,基本要点其实只有三句话:1.极性匹配,两种材料在熔体状态下能分子链段互溶加穿透
2024-09-23 10:11:00
闪送IPO大考:融资遇停滞、市场被瓜分,闪送的市场翻身仗能否成功?
文|罗曾 实习生于琪成立十年,透露上市消息四年,闪送终于要“尘埃落定”了。近日,闪送(BingEx Limited)正式向美国证券交易委员会(SEC)递交招股书
2024-09-23 10:14:00
他山科技创始人马扬:触觉传感芯片是机器人必经之路
“我们都没做过芯片,但我们觉得这事必须要做出来。”2016年,第一波机器人浪潮翻涌而来,马扬发现,触觉传感器是一片被忽视的蓝海
2024-09-23 13:33:00
549元!地瓜RDK X5 开发板发布,机器人加速拥抱大模型
作为中国乃至全世界的AI硬件中心,深圳对机器人产业的影响力是毋庸置疑的。因此,地瓜机器人选择在深圳继续举办「开发者日」
2024-09-23 13:33:00
月流水300万美金,日活用户20万,美国人超爱为情绪疗愈买单?
上线3年,情绪管理应用Finch在ins上积累了23万粉丝,单月下载量超55万,刚刚过去的8月,Finch月流水超100万美元
2024-09-23 13:34:00
雷军:Note14系列,9月26日晚7点发布
9月23日,小米董事长雷军发文:Note 14 系列,定档9月26日晚 7 点。Note 新十年首款作品,小金刚在进化
2024-09-23 13:52:00
江苏中塑TPE|TPE原料的硬度越大越硬吗?
TPE原料的应用领域很是广泛,每个用户对TPE原料物性的选择差异化很大。所以选择一家可以定做TPE改性原料的生产厂家就至关重要了
2024-09-23 10:20:00
普惠金融是中央金融工作会议提出的“五篇大文章”之一,是银行业服务实体经济、助力社会高质量发展的重要领域。民生银行始终秉承“服务大众
2024-09-23 10:29:00
本文转自:人民网-广西频道冯肖慧“以旧换新,你家参与了吗?”“好划算!”“优惠力度真大!”今年以来,广西推出一系列消费品以旧换新主题活动
2024-09-23 10:39:00
《厕用湿巾》团体标准正式发布
为推动厕用湿巾行业规范化与高质量发展,9月21日,《厕用湿巾》标准发布会在上海新国际博览中心召开。会议由中国产业用纺织品行业协会主办
2024-09-23 10:42:00