• 我的订阅
  • 头条热搜
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
【新智元导读】是时候用CPU通用服务器跑千亿参数大模型了!马斯克19天建成由10万块H100串联的世界最大超算,已全力投入Grok 3的训练中。与此同时,外媒爆料称,OpenAI和微软联手打造的下一个超算集群,将由10万块GB200组成。...……更多
AI大厂硬刚价格战,中小模型夹缝求生存
...资源和成本也越相应增加。而承载超大参数量的背后则是服务器数量。据安信证券测算,目前ChatGPT每天所需的算力约50EFLOPs,所需服务器约1万台,若ChatGPT的用户量继续保持上涨,假设到24年底用户数量为5亿,则需要23万台服务...……更多
微软紧随英伟达发布芯片,老黄还不慌吗?
...大在于,建立了完整的自研芯片产业链,形成网络芯片、服务器芯片、AI芯片三条产品线。在AI芯片领域,亚马逊的自研产品就通用计算芯片、机器学习训练芯片、学习推理芯片等。满打满算,从2013年推出首款自研芯片Nitro1以来...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...让腾讯具备了更强的“全局优化”能力。从自研的星星海服务器,到新一代HCC高性能计算集群,再到自研的星脉高速网络,腾讯已经为自己打造了一整套面向AIGC的高性能智算网络。据腾讯内部负责人介绍,目前腾讯云已经可支...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
...首先有自研全功能GPU,基于GPU做出计算加速卡,再组建成服务器,放进超融合一体机,然后将这样的4台机器整合到一个机柜里,形成一个小集群,小集群连成大集群,大集群的线性加速比高于91%。有了这样一个灵活组合的集群...……更多
大模型厂商急寻PlanB:英伟达改良版芯片已调试 华为等国产算力供应不足
...,英伟达面向中国市场的改良版——HGX H20已与国内头部服务器厂商在进行适配测试,由于具体的性能差异和优化程度挂钩,目前还很难对其与高配版H800做性能对比,但是,预估HGX H20的8卡服务器仍高达百万级。英特尔则对Gaudi 2...……更多
科技云报到:云服务的中场战事,从AI应用开始
...的核心能力基本停留在IaaS层面的“计算、存储和网络”服务器相关三大件领域,对于PaaS层的云服务能力相较落后于AWS等一众海外云厂商。但实际上,云厂商的价值则是要向PaaS平台发展的。“把IaaS、PaaS以及SaaS三者的优势拿出来...……更多
存储市场“供销两旺”原厂业绩好转,AI对存储应用市场提出要求
...近日在线上对记者分析说。进入2023年,除传统手机、PC和服务器市场外,ChatGPT开启的AI大模型浪潮、汽车智能化浪潮带来更多商业机会,这些应用场景对数据存储的容量、效率、流动性和安全性等方面提出了更高的需求。面对新...……更多
英特尔预计2024年正式上市Gaudi3,用于生成式AI模型
...伴和7家云服务商基于第五代至强处理器准备好了全新的服务器和云服务。”英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立称。自去年年底ChatGPT发布以来,大语言模型技术支持下的AIGC应用获得了极大的发展。而这...……更多
Sora这就落伍了?Meta“最强视频模型”不用DiT,用Llama大力出奇迹了
...行功率为 700W TDP,配备 80GB HBM3,采用 Meta 的 Grand Teton AI 服务器平台Baumgartner 和 Bowman,2022。在一台服务器内,有八个 GPU 通过 NVSwitch 进行均匀连接。服务器之间的 GPU 则通过 400Gbps RoCE R……更多
推理性能飙升1.5倍!微软疯狂下单GB200芯片提升其AI算力
...展其AI计算能力。根据NVIDIA官方给出的数据,新一代GB200服务器系统在Llama 3.1 700亿参数大模型上的AI推理性能对比H200提高了足足1.5倍。此外,微软还计划在低温数据中心部署GB200服务器,以缓解冷却系统的潜在压力。其他云服务...……更多
AI服务器缺货真相调查:两天涨价30万,连“味精大王”都入场了
几乎是一夜之间,AI服务器价格在国内市场中飙升。智东西从一位服务器渠道销售人员处得知,搭载英伟达A800 GPU的热门AI服务器型号的价格已达140~150万元/台,比今年6月上涨超40%;搭载8颗英伟达H800 GPU的AI服务器价格上涨则更离...……更多
前商汤通用模型负责人打造3D大模型「Tripo」,3D生成迈入「秒级」时代 | 早期项目
...战,实现通用且可扩展的解决方案。这对算法、数据量、服务器等有很高的要求一一不过这恰恰也是VAST团队的核心优势。VAST这一思路提高了生成模型的成功率和效率。目前,已经实现8秒钟生成带纹理3D网格模型,可以进入传统...……更多
阿里云挥出“三板斧”:免费也要挣到钱
...下来的模型“放置”在任何一个云厂商平台上,通过虚拟服务器跑起来。上述人士介绍,在第二种形式中,阿里云构建了百炼平台、灵积(DashScope)平台等,为用户提供模型训练、推理等所需的算力服务。这些平台不仅支持阿里...……更多
联想与英伟达联合发布全新液冷AI服务器:可实现万亿参数AI模型
...联想混合式AI全面优势集,推出ThinkSystem SC777 V4 Neptune,该服务器利用新的ThinkSystem N1380 Neptune,号称在紧凑的设计中实现万亿参数的AI模型。ThinkSystem N1380 Neptune垂直液冷机箱专为行业标准19英寸机架而设计,可……更多
英伟达特供芯片卖不动了?黄仁勋穿上东北花袄“示好”,中国大厂难掩AI野心
...囤货,大批量购买A800、H800等英伟达芯片,目前已部署的服务器总量尚能支撑市场需求,故而对“减量不减价”的H20兴致缺缺。而前人工智能NLP企业首席科学家、千芯科技董事长陈巍进一步向时代财经记者透露,国内交易市场中...……更多
有了它,断网也能“纵享丝滑”
...网络,如果网络不稳定,信号覆盖不到或者信号质量差,服务器处理能力不行的情况下,它的识别会非常不稳定。其次就是云端无法保证用户的隐私安全,存在泄漏风险。再就是云端的运行成本非常高,因为它要搭建,涉及到搭...……更多
00后华裔小哥哈佛辍学组团挑战英伟达,史上最快AI芯片Sohu推理性能超H100二十倍!
... ASIC。通过专门化,Sohu获得了前所未有的性能。一台8xSohu服务器每秒可以处理超过50万个Llama 70B token,等效于160块H100 GPU。Sohu仅支持Transformer推理,并支持当今所有的模型(Google、Meta、Microsoft、OpenAI、Anth……更多
AI手机没有独家大模型供应商
...是一项长期消耗成本、且暂时还无法停下的趋势,无论是服务器消耗的电力、相关研发等都需要持续的投入。算法交易公司Deep Trading就曾指出,ChatGPT4以1.8亿用户基数和每人100Ktoken/天计算,每日成本就高达88.2万美元。此前vivo副...……更多
够21万人喝一辈子的水 还不够谷歌服务器用7个月
...水?今天就来跟大家聊聊,那些互联网巨头们都是怎么给服务器散热的。有什么办法,能把杭州西湖的水给用完?这是杭州西湖,三面环山,面积约6.39平方千米,南北长约3.2千米,东西宽约2.8千米,水体容量约为1429万立方米。...……更多
大模型价格战“卷”向何方?|深度
...掀起了“降价潮”,阿里、百度、腾讯等纷纷加入战团。大厂“钱多、卡多、算力足”无惧价格战,以惯有的免费模式先聚集用户与开发者。中小大模型创业公司普遍还在勒紧腰带苦苦打造爆款应用,也不得不匆忙接招。大模型...……更多
AI时代不甘落后:英特尔全新软硬件平台助力企业加速创新
...外机架密度也是上代的2.7倍。英特尔称72个机架的新一代服务器就能完成过去200个机架服务器的工作量,差不多节省了1兆瓦的功率,能够满足1300个家庭的能源需求。 在边缘计算上,英特尔AI硬件也同样给力,预计到2030年,边缘...……更多
手搓AI大模型应用获25万用户,果断辞职创业,结果收入不如摆摊
...本,并构建了自己的消息服务(这是最难的部分),所以服务器成本每月不到 500 美元。终于,作者对 50% 的月度增长感到信心十足,应该会持续增长,然后开始赚钱了吧。4 个月前,此人辞去了工作,开始了创业之路。明星 AI ...……更多
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
...消息称三星担心传输至生成式AI平台的数据被存储在外部服务器上,已禁止员工使用ChatGPT、谷歌Bard等生成式AI工具。开源之后对大模型企业而言,开源与闭源并不矛盾,企业在开源与闭源、收费与免费之间选择,阿里云是在闭源...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
...型部署:将训练好的模型部署到生产环境中,可能包括云服务器、边缘设备或特定硬件上。 2、API集成:提供API接口,使得模型可以被其他应用程序调用,实现模型服务的快速集成。 3、应用开发框架:提供一套框架和工具,帮...……更多
AI泡沫不可避免!李彦宏敲响警钟:PMF是生存关键
...其中人工成本最低,每年“仅”需约15亿美元;租用微软服务器为ChatGPT及底层LLM提供动力的推理成本,一年约40亿美元;包含数据费用在内的训练成本,一年则需要约30亿美元,未来则将突破100亿美元。至于中国AI领先者百度,在...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...更多是针对生成式 AI 所研发的训练芯片。每个TPU v5p pod(服务器组)都由8960个芯片组成,它通过TPU带宽最高的芯片间互连(ICI)以每秒4800Gbp速度在3D拓扑结构中连接。与TPU v4相比,TPU v5p的Flops性能提高了2倍以上,高带宽内存(H...……更多
【科技早报】联想、英特尔、爱奇艺签署谅解备忘录;国内低轨卫星通信测试成功
...“云工开物”计划,给中国所有在校大学生每人送一台云服务器在10月31日举办的2023云栖大会上,阿里云首席技术官周靖人发布阿里云高校计划“云工开物”,计划将为中国所有在校大学生免费提供一台云服务器,所有高校学生...……更多
昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE
...用并落地的开源千亿MoE大模型,也是首个支持用单台4090服务器推理的开源千亿MoE大模型。开源地址Skywork-MoE的模型权重、技术报告完全开源,免费商用,无需申请。模型架构本次开源的Skywork-MoE模型隶属于天工3.0的研发模型系列...……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...用功能。若愚九天机器人大脑架构若愚科技选择将和头部服务器厂商合作,通过服务器厂商的核心需求,来覆盖不同领域的70%、80%的场景。未来,公司计划在与中长尾客户合作时,进一步增加客户需要的功能。若愚科技已经完成...……更多
更多关于科技的资讯:
2025“星耀巴南·菁储行未来星”人才计划首站走进重庆科技大学
3月7日,巴南软件园&重庆数字经济人才市场巴南市场携手巴南优质软信和数字经济企业开启2025“星耀巴南·菁储行未来星”人才计划首站——重庆科技大学
2025-03-10 23:08:00
蔚来李斌:别人家孩子都已经上大学了 我们还在复读
快科技3月10日消息,据36氪汽车报道,今年2月25日,一名即将离职的蔚来员工发长文吐槽,提出十条建议,呼吁公司应尽快从务虚转化为务实
2025-03-10 23:18:00
李想亮相湖南卫视节目:我比所有做汽车的更懂互联网
在湖南卫视近日播出的《夺金2025》创业节目中,六名青年创客抵达了北京理想汽车总部,开展了多维度的研学实践。作为理想汽车CEO
2025-03-10 23:18:00
深圳机器人跑步惊呆歪果仁 与人类无异 网友:北马见
国产机器人,再次惊呆了歪果仁。这一次,靠的是像极了人类的跑步姿势,来感受一下这个feel:这便是深圳众擎机器人最新发布的视频
2025-03-10 23:18:00
劳力士手表价格暴跌 有人卖块表赔了一台保时捷
快科技3月10日消息,据报道,二手劳力士手表价格近期正在持续下跌。“熊猫迪”已从40万元跌到19万元,一些型号更是跌破了劳力士发行的公价
2025-03-10 19:48:00
182.3米世界坝体最高!江苏句容抽水蓄能电站3号机组并网发电
快科技3月10日消息,据央视新闻报道,今天位于江苏句容市的国网新源江苏句容抽水蓄能电站3号机组正式并网发电。至此,该站首批3台机组已全部投运
2025-03-10 19:48:00
出色影像加持,华为nova 13 Pro氛围感照片触手可得
在这个时代,一张好看的照片胜过千言万语。你是否曾经因为拍不出美照而错失记录生活的机会?是否曾因为不会给女朋友拍照而被嫌弃
2025-03-10 19:48:00
网友买到三只松鼠发霉面包要求道歉 客服:赔偿2000元 道歉信没有
近日,据媒体报道,有网友买到三只松鼠发霉面包。该网友称,该发霉面包是从三只松鼠电商旗舰店购得,入口后闻到臭味,发现面包发霉现象
2025-03-10 19:48:00
网友脑洞大开!华为Pura 80鬼才设计图曝光
快科技3月10日消息,有网友放出了一张华为Pura 80的“鬼才设计图”,其最大看点是镜头模组是四分之一圆,四台手机组合在一起就能拼成一个完成的圆形
2025-03-10 19:48:00
对话全国政协委员、康希诺朱涛:疫苗出海需创新与差异化,国家免疫规划扩容是必然趋势
“我们不可能一天就把免疫计划扩容到跟发达国家一样多的品种。随着国内企业在疫苗供给、疫苗质量和技术水平方面的逐步提高,国家免疫规划扩容必然会来临
2025-03-10 19:54:00
秒“算”神机,西部大山为“哪吒”生出澎湃算力|贵州有“数”
据网络平台数据:《哪吒之魔童闹海》(《哪吒2》)全球电影票房(含预售及海外)超越《复仇者联盟3:无限战争》进入全球票房榜前6名
2025-03-10 20:15:00
13万就有激光雷达智驾!零跑B10搭同级唯一高通8650智驾芯片
快科技3月10日消息,零跑汽车今日晚间举办零跑B10预售发布会。零跑汽车介绍,B10为13万级首搭激光雷达高阶智驾的车型
2025-03-10 20:18:00
“县城贵妇”们开始纷纷加入二手经济
快科技3月10日消息,近日,转转集团发布2024女性二手消费洞察。数据显示,2024年转转平台女性用户同比增长70%,女性用户在高价值品类的交易中占比显著提升
2025-03-10 20:18:00
10倍长!微信正式官宣:朋友圈可以发5分钟视频了
快科技3月10日消息,微信,作为我们日常生活中不可或缺的社交工具,一直在不断创新和优化,为用户带来更加丰富的使用体验。以往
2025-03-10 20:18:00
鲁网3月10日讯(记者 陈珊珊 通讯员 韩巧苓)在人工智能技术飞速发展的当下,楼宇经济作为城市产业的关键支撑,正面临着数字化
2025-03-10 20:43:00