• 我的订阅
  • 头条热搜
LLM训练通信量减少10000倍!全新分布式优化器,整合世间算力训练强大AI
...search宣布了一项重大突破,通过使用与架构和网络无关的分布式优化器,研究人员成功将训练LLM时GPU间的通信量降低了1000到10000倍!如果可以使用世界上所有的算力来训练AI模型,会怎么样?近日,凭借发布了开源的Hermes 3(基...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...器翻译性能。2020年,谷歌Gshard首次将MoE引入Transformer构建分布式并行计算架构,打开MoE发展新思路。之后,MoE逐渐进入规模发展阶段,作为一种底层架构优化方法,与Transformer结合,陆续被用于推荐系统、自然语言处理、计算机...……更多
新一代aigc技术的发展
...PFC相关的死锁问题,确保了网络的无缝和不间断的运行。分布式操作系统提高可靠性在DDC架构中,管理功能在网络控制卡(NCC)的控制下进行集中管理。然而,这种集中控制存在单点故障的潜在风险。为了减轻这个风险,DDC采用...……更多
美欧亚三洲开发者联手,全球首个组团训练的大模型,全流程开源
...究挑战。当今最大的 AI 实验室也还没有彻底解决在多个分布式数据中心上的容错训练。该团队表示,Prime 这种全新的去中心化训练框架支持容错训练,支持计算资源的动态开启/关闭,还能优化全球分布式 GPU 网络中的通信和路...……更多
腾讯Angel获世界互联网大会领先科技奖:让通信成本降低70%
...评选委员会点评腾讯Angel机器学习平台:突破万亿级模型分布式训练和推理以及大规模应用部署等难题。据了解,突破主要在通信、效率、规模三方面实现。通信:从网卡到交换机,再到路由协议,腾讯自研的RDMA网络实现了集群...……更多
用60%成本干80%的事,DeepSeek分享沉淀多年的高性能深度学习架构
...HaiScale:针对深度学习模型训练进行特别的优化 HaiScale 分布式数据并行(DDP)是一种以 HFReduce 为通信后端的训练工具。这类似于 Python 的以 NCCL 为后端的 DDP。在反向传播阶段,HaiScale DDP 会对计算出的梯度执行异步 allreduce ……更多
革新实践丨零极分布式AI算力调度平台,实现智能算力普惠输出!
...为服务购买方提供更加丰富的业务支撑与算力服务。零极分布式AI算力调度:算力的革新实践零极分布式AI算力调度平台基于零极分布式可信云底层架构,零极分布式可信云是从底层架构进行自主研发的技术体系,完全自主可控...……更多
行业丨抢滩下一个高地,分布式云计算迎来黄金发展期!
随着技术的发展和市场的不断变化,分布式云计算正逐渐成为云计算领域的重要趋势。2024年,分布式云计算将继续保持强劲的发展势头,为企业和个人提供更加高效、灵活、安全的服务。同时,分布式云计算正迎来一个全新的...……更多
腾讯钟学丹:人工智能成为汽车行业新质生产力 推动数智化升级
...模型进化提供高性能、高带宽、低延迟的算力支持。腾讯分布式云原生调度总规模超过1.5亿核,并提供16EFLOPS的智算算力,不仅能服务于大模型训练,还将在自动驾驶等场景中充分应用。新一代HCC高性能计算集群,搭载最新次代G...……更多
国产GPU为底座,摩尔线程首个千卡智算中心落地
...ink1.0技术,MTT S4000可以支持多卡互联,助力千亿大模型的分布式计算加速。同时,MTT S4000提供先进的图形渲染能力、视频编解码能力和超高清8K HDR显示能力,助力AI计算、图形渲染、多媒体等综合应用场景的落地。尤为重要的是...……更多
Llama3训练每3小时崩一次?豆包大模型、港大为脆皮万卡训练提效
...统进行统一的 Checkpoint 管理以及性能优化带来了挑战。 分布式训练系统的用户面临多重困扰从训练系统的用户( AI 研究科学家或工程师)的角度出发,用户使用分布式训练系统时,在 Checkpoint 方向往往会被三个问题困扰:1)...……更多
大规模分布式系统架构:应对海量用户和数据的挑战
来源:极目新闻在数字化时代,大规模分布式系统已成为支撑许多互联网服务的核心。这些系统必须应对海量用户和数据的挑战,以提供高性能、高可用性和可扩展性的服务。本文将深入探讨大规模分布式系统架构的重要性以...……更多
华为智慧办公产业发展“破”与“立”
...公产品品类,移动应用引擎、超级终端等创新技术,鸿蒙分布式组件的平台能力进行垂直整合,并依托分布式软总线、分布式数据管理、分布式任务调度等鸿蒙分布式技术,带来了全新的交互体验,打破了生态间的壁垒。华为移...……更多
鸿蒙x昇腾云:华为打造智能时代最佳AI基础设施
...供了源源不断的算力。朱勇刚表示,全新的鸿蒙生态具备分布式、全场景、原生智能等一系列新的特点,将为未来的服务生态、内容生态包等,激发出全新的创新焦点和活力,并能基于此打造全新的创新体验。鸿蒙不仅仅是一个...……更多
云计算一哥终于搞多模态了:一口气6个大模型,还有个3nm芯片!
...可达2TB/s的带宽,而延迟仅为1微秒。 它的设计特别适合分布式深度学习任务,在网络通信上的优化有助于显著缩短训练时间,提升资源利用率。用官方的话来说就是:这正是训练万亿级参数的大型人工智能模型所需要的超级计...……更多
我国中科大团队在量子网络领域取得重要进展
...在合肥市区实现了跨越 7 公里的非局域量子门,并演示了分布式的 Deutsch-Jozsa 算法及量子相位估计算法。该成果 10 月 2 日发表在国际期刊《自然・通讯》上。▲ 图 1:跨越 7 公里的非局域量子门。a.量子节点分布地图和实验装置...……更多
和谐共生 建成绿美繁荣的韧性之城
...氢气”体系建设,积极利用太阳能等可再生能源。构建以分布式能源站、区域供冷系统集中生活热水系统为主的多层级综合分布式能源体系。推动产业升级,重点发展先进制造业和现代服务业。基于产业区块建设零碳工业园区,...……更多
...、量子计算与量子通信、现代移动通信网络、电力输送和分布式智能电力系统技术、储能系统和氢能、机器人和机电一体化组件技术、传感器技术、微电子和光子学、新材料、控制生物体特性的技术、生命科学中的分子工程、医...……更多
大模型观察|从训练到落地金融业,大模型“升级之路”面临哪些挑战?
...PT-3,用一张卡训练一个模型要耗时32年,所以业界引入了分布式训练的方法。所谓“内存”墙,则说的是千亿级参数完全加载到显存大概需要几个TB,单显卡的显存已经无法加载千亿级参数。此外,大模型并行切分到集群后,模...……更多
...高的实时性。未来该算法可应用于量子通讯、卫星通讯、分布式存储、6G通讯、智算中心等领域,在智算领域可以为人工智能(AI)和机器学习(ML)训练网络提供低延迟、高吞吐量和高带宽,在分布式存储领域可以大幅度提升全...……更多
Meta版慢思考来了!田渊栋团队整合快慢思考,能走迷宫推箱子
...acebook担任研究科学家,帮助Facebook建立了广告推荐模型的分布式训练系统。Sainbayar Sukhbaatar是FAIR的研究科学家,主要负责大模型推理和记忆方面研究。他曾先后在谷歌、DeepMind、Meta任职。Michael Rabbat是FAIR的创始成员之一。加入Me……更多
江苏移动赋能无锡,共铸人工智能产业新篇章
...功能设计,为AI开发者提供了在线开发调试环境、大规模分布式训练以及自动化模型生成能力,助力开发者高效完成算子开发、算法开发、数据管理、模型训练等关键开发任务。而AI运维管理平台则整合了AI算力、软硬件能力、安...……更多
...战任务,已成为未来作战的重要发展方向。外军提出的“分布式作战”“马赛克战”等作战概念,内核就是利用在物理空间分散的各型作战装备,通过一体化作战网络,实现智能协同,达成“形散能聚”的作战效果。为此,无人...……更多
这次,华为真的“强得飞起”
...主框,副框空间未能有效利用。在这一方面,华为首创的分布式玄武架构,对折叠机主框和副框的零部件全新布局设计, 极大程度增加了整机器件的空间,让机身更轻更薄的同时,为天线、散热等元器件提供了更充裕的空间。...……更多
算网筑基 拥抱智能 中国联通重磅发布最新智算成果赋能产业发展
...冀、大湾区、粤港澳等重点区域间毫秒级超低时延。针对分布式训练推理场景,推出AI边缘一体机产品。目前已联合元景大模型推出了AI边缘一体机——“元景版”。提供包括数据处理、模型训练、算法部署、模型运营的AI产品服...……更多
...新型电力系统为着力点,推动新型能源体系建设。海量的分布式新能源、电动汽车、充电桩、分布式储能得到快速发展。一方面,源网荷储四维互动成为电力系统实时动态平衡的关键。另一方面,各类分布式新能源、负荷终端操...……更多
全球首个!中国电信完成千卡、千亿参数模型500公里联合训练试商用
...电信成功了 完成业内首个1024卡、千亿参数商用大模型的分布式联合训练真实用户试商用。通过天津市武清区到北京市大兴区瀛海镇之间的真实光路环回,实现了500公里长距互联分布式训练,而且训练性能达到单数据中心的97%以...……更多
华为matex6将搭载全新的分布式玄武架构
...满悬念的视频,正式宣布其即将推出的MateX6将搭载全新的分布式玄武架构。视频中展示了高温炙烤、寒冰冷冻、刮擦测试、撞击挑战及悬挂重物等五个极端测试场景,暗示MateX6将拥有卓越的耐用性和抗造能力,这一特性在其前代...……更多
摩尔线程kuae千卡集群正式落地
...Link1.0技术,MTTS4000可以支持多卡互联,助力千亿大模型的分布式计算加速。同时,MTTS4000提供先进的图形渲染能力、视频编解码能力和超高清8KHDR显示能力,助力AI计算、图形渲染、多媒体等综合应用场景的落地。尤为重要的是,...……更多
布局颠覆性技术,领存突破MRD码复杂算法
...质量和效率。 使用网络编码和MRD技术,可以助力中国的分布式和云计算走到世界的最前沿,改变高端存储一直被海外巨头垄断的竞争格局。在分布式计算和云服务中,数据的同步和一致性是关键挑战之一,MRD码的强大纠错能力...……更多
更多关于科技的资讯:
又到了每年山东跪拜刷屏的日子 网友:礼仪之邦
1月29日消息,据媒体报道,今天是大年初一,又到了每年山东硬核拜年刷屏的日子,大家排队下跪磕头。网友表示,不愧是礼仪之邦
2025-01-29 12:37:00
余承东用华为Mate XT给大家拜年:祝大家屏屏见喜 强得飞起
快科技1月29日消息,今天是大年初一,余承东用华为三折叠屏Mate XT非凡大师给大家拜年,祝大家一开迎春,二开纳福,三开大展鸿图
2025-01-29 13:37:00
春晚机器人下场时脚步直哆嗦:春晚最靓的仔
快科技1月29日消息,在央视蛇年春晚中,创意融合舞蹈节目《秧BOT》引起了广泛的关注。这些机器人下场时拿手绢脚步直哆嗦
2025-01-29 14:07:00
金晨给被砸中的小孩儿道歉:本想扔给观众的吉祥物正中你后脑勺
1月29日消息,今天,微博话题“金晨你怎么可以捅这么大的篓子”冲上热搜榜。据报道,在昨天的央视春晚舞台上,演员金晨把手里的蛇年吉祥物扔了出去
2025-01-29 14:07:00
B站蛇年春晚直播观看人数超1亿!30岁以下观众超八成
快科技1月29日消息,B站是央视蛇年春晚独家弹幕视频合作平台,今日已经公布了除夕当晚的相关数据。除夕当晚,B站春晚直播间观看人数创历史新高
2025-01-29 15:37:00
马丽甲状腺冲上热搜第一 网友喊话:丽姐注意身体
1月29日消息,微博话题“马丽甲状腺”冲上热搜榜第一名。据报道,在2025年央视蛇年春晚舞台上,沈腾、马丽演绎小品《金龟婿》
2025-01-29 16:07:00
今年春晚上小米SU7 Ultra车模又被“薅”走了:只剩底座
快科技1月29日消息,昨晚的春晚开始之前,小米集团董事长特别助理、战略市场部副总经理徐洁云透露,去年春晚现场首次登台的小米SU7车模散场后被“带走”
2025-01-29 16:07:00
春晚小品呼唤小爱同学!小米:全球小爱同学被唤醒超亿次
快科技1月29日消息,在今年的春晚上,小品《小明一家》节目上呼叫了小爱同学,主角小明的爷爷提出有问题找同学,小明爸爸问找什么同学
2025-01-29 16:37:00
270亿次!2025年央视春晚传播数据再创新高:破多项纪录
快科技1月29日消息,据官方数据,截至1月29日2时,央视春晚全媒体累计触达168亿人次,比去年增长了18.31%,其中移动端受众规模3
2025-01-29 17:07:00
温暖无数观众!春晚王菲唱的歌原来改了一个字
1月29日消息,据媒体报道,时隔七年,王菲带着一首《世界赠与我的》第五次登上春晚舞台,温暖了无数观众。这首歌由袁晶作词
2025-01-29 17:37:00
春晚机器人失误是故意设计的彩蛋:未来或能替人上班
1月29日消息,据媒体报道,在央视春晚上,宇树科技人形机器人H1登上舞台与人类演员共同呈现了名为《秧Bot》的节目。它们动作流畅
2025-01-29 17:37:00
“DeepSeek甚至绕过了CUDA”!论文细节再引热议 工程师灵魂提问:英伟达护城河还在吗
英伟达刚刚从DeepSeek-R1引发的4万亿元暴跌中缓过劲来,又面临新的压力?硬件媒体Tom‘s Hardware带来开年最新热议
2025-01-29 18:07:00
豆瓣9.1口碑神剧!《家有儿女2》明日上线B站
快科技1月29日消息,上周,童年神剧《家有儿女》第一季正式上线B站,会员可免费观看全集。根据B站官方预告,《家有儿女》第二季也将在明天正式上线
2025-01-29 18:07:00
高通骁龙X2新系列CPU现身!比Elite更加高端
快科技1月29日消息,高通的第二代骁龙笔记本电脑芯片正在开发中,且相关SKU已出现在发货清单上。据Olrak_29透露
2025-01-29 20:07:00
力挺!Intel前CEO已在新公司用DeepSeek代替OpenAI
快科技1月29日消息,英特尔前CEO帕特·基辛格(Pat Gelsinger)日前在社交平台发文,高度赞赏了开源AI推理模型DeepSeek
2025-01-29 20:37:00