• 我的订阅
  • 科技

DeepSeek第二炸:开源首个用于 MoE 模型训练通信库

类别:科技 发布时间:2025-02-25 11:33:00 来源:浅语科技

快科技2月25日消息,今天是DeepSeek开源周第二日,一早,DeepSeek如约就放出了开源代码库DeepEP王炸。

据了解,DeepEP是首个用于 MoE 模型训练和推理的开源 EP 通信库,它填补了MoE模型专用通信工具的空白,为大规模分布式AI训练和实时推理场景提供了更高效的底层支持。

在这里,简单介绍一下DeepEP的技术性能特点:

1、高效通信架构

支持优化的全对全通信模式,实现节点内和节点间的NVLink与RDMA互联,提升数据传输效率

2、多精度与调度优化

原生支持FP8低精度运算调度,降低计算资源消耗。

3、重性能内核

据介绍,高吞吐量内核可适用于训练和推理预填充场景,最大化数据处理能力;

4、低延迟内核

它针对推理解码场景设计,采用纯RDMA通信和自适应路由技术,减少延迟。

5、资源控制与重叠机制

通过灵活的GPU资源控制策略,实现计算与通信过程的高效重叠,避免资源闲置。

6、深度优化场景

针对NVLink到RDMA的非对称带宽转发场景进行专项优化,提升异构网络下的传输性能;

此外,它还支持SM(Streaming Multiprocessors)数量动态控制,平衡不同任务(如训练与推理)的吞吐量需求。

DeepSeek第二炸:开源首个用于 MoE 模型训练通信库

DeepSeek第二炸:开源首个用于 MoE 模型训练通信库

【本文结束】如需转载请务必注明出处:快科技

责任编辑:秋白

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-02-25 14:45:11

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

大模型新趋势之MoE:现状、挑战及研究方向
2024年,全球主流企业加快推出MoE大模型,1-5月发布千亿以上大模型均采用MoE优化架构,且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势,更适合
2024-11-04 16:00:00
DeepSeek,大消息
...度提升25倍,并且每token成本降低20倍的惊人成果。这一新模型的推出,标志着英伟达在人工智能领域的又一次重大进展
2025-02-27 15:51:00
从狂热到理性:大模型训练三堵墙,一场少数人的游戏 | 钛媒体深度
...PU卡,把服务器买走都行”。3月份开始,张阳明显感受大模型带来的冲击,作为一家云厂商算力平台负责人,他意识到市场甚至有些盲目。“当时客户比较慌,相当于对产品都没有什么要求,不
2023-06-29 12:00:00
...来网络研究院”)签署战略合作框架协议。各方将围绕大模型核心技术联合攻关,力争在3-5年内实现行业大模型技术创新能力江苏领先水平,在全国具有示范意义。同时,多方合作还将共建江苏
2023-08-25 05:54:00
百度智能云两大基础设施再升级!打造AI时代最开放的智能基础设施
4月25日,以“模型的世界,应用的天下”为主题的Create2025百度AI开发者大会在湖北武汉召开。会上,百度集团执行副总裁、百度智能云事业群总裁沈抖分享了百度智能云在智能基础
2025-04-25 16:27:00
AI大模型“战火”从互联网烧到了手机侧,谁在提前布局?
尽管大模型算力消耗惊人,但这并没有阻止各大科技公司将AI应用于其他设备,比如智能手机。一个月内,已有多家科技厂商对AI大模型在手机上的应用作出公开表态,以自研或者合作的方式进入这
2023-07-05 17:50:00
中兴通讯:全栈全场景智算解决方案,助力行业智能化转型升级
...发展新质生产力注入高效算力随着人工智能迅速发展,大模型的迁移成本和开发门槛成为影响AI创新的重要因素。为此,中兴通讯推出AI训推平台(AI Studio),简化创新之路、降低
2024-07-05 07:17:00
当大模型Scaling Law继续,万卡集群算力释放在百舸找到一条通途
...一世纪什么最贵?人才!」而随着人工智能行业进入到大模型时代,这一问题的答案已然变成了「算力」。随着模型规模急剧扩张,参数已经飙升到了千亿甚至万亿级,业界开启了千模大战,AI
2024-09-26 13:37:00
腾讯Angel获世界互联网大会领先科技奖:让通信成本降低70%
...奖。评选委员会点评腾讯Angel机器学习平台:突破万亿级模型分布式训练和推理以及大规模应用部署等难题。据了解,突破主要在通信、效率、规模三方面实现。通信:从网卡到交换机,再到
2024-11-21 09:55:00
更多关于科技的资讯:
参展企业334家,展位数再创新高达840个斩获银奖!“南京智造”闪耀广交会南报网讯(记者黄琳燕通讯员宁商轩)第138届广交会将于10月15日在广州开幕
2025-10-15 08:09:00
“云”上调度 雨中守护|雷沃数智化服务为抢收装上智慧大脑
秋收关键期遭遇连绵阴雨,让秋收秋种受阻。除了满足抢收抢烘抢播的智能农机,潍柴雷沃还创新数智化服务,通过智能调度与精准服务
2025-10-15 01:05:00
茶酒融合催生“微醺”新赛道,新茶饮品牌争饮“昼夜”经济
当白天的提神茶饮与夜晚的放松酒品打破边界,正催生出国内消费市场一股新的“微醺”风潮。近期,茶百道经典白酒奶茶回归即创下销量佳绩
2025-10-14 11:33:00
嘎子谢孟伟被执行超1400万,已被限高,此前因穿警服带货被行拘7日
近日,因穿警服直播带货被行政拘留、账号遭封禁的嘎子谢孟伟发视频称 “我回来了”,并向所有观众诚恳道歉。视频中,其透露公司员工已被安排回老家
2025-10-14 11:33:00
平谷将打造全国农业科创中心
原标题:世界农业科创大会开幕 农业中关村核心区2.0发布平谷将打造全国农业科创中心本报讯(记者 赵婷婷)昨天,2025世界农业科技创新大会(WAFI)在北京平谷开幕
2025-10-14 11:59:00
据大象新闻报道,近期蜜雪冰城的小票成了年轻人追捧的“追更凭证”,其上连载着名为《雪王在古代卖咖啡》的小说,20个章节随机印在消费小票上
2025-10-14 12:10:00
电通创意发布《2025首席营销官报告》:算法与人性的重构力量
AI时代,品牌的长期价值回归于人性与文化共鸣,人类的创造力、同理心与文化相关性愈加重要。•AI已成日常:几乎所有CMO都在使用AI
2025-10-14 13:29:00
近日,一则“美团外卖骑手能屏蔽顾客”的消息在网络上引发热议。据媒体报道,美团已在福建晋江、浙江绍兴等七个城市试点上线骑手评价用户和屏蔽用户功能
2025-10-14 13:40:00
这座产业园一年制造千万颗球胆、百万颗整球——沂南县“造球记”
齐鲁晚报·齐鲁壹点 记者 公绪成 李其峰 通讯员 陈婉塑炼、分切、热压......沂南县泽辉体育产业园内,工人们正紧忙制作新一批篮球内胆10月9日
2025-10-14 15:00:00
在数字经济奔涌向前的浪潮中,VR正加速与新一代信息技术融合,不断催生新的应用场景。紧抓发展机遇,江西移动聚焦VR产业发展的核心问题
2025-10-14 16:02:00
行业首个!海尔智家牵头制定《智能门锁安装和售后服务要求》
据洛图科技数据显示,2025年上半年,中国智能门锁市场全渠道销量达到897万套,同比增长6.8%。面对日益增长的智能安防需求
2025-10-14 16:14:00
蜜雪冰城卖啤酒,5.9元一杯冲上热搜!网友:期待雪王啤酒了
10月14日,蜜雪冰城啤酒5.9元一杯冲上微博热搜榜。10月1日,蜜雪集团在港交所发布的公告显示,蜜雪冰城以2.856亿元增资认购鲜啤福鹿家新增注册资本
2025-10-14 16:40:00
【宅男财经|专家面对面】据媒体报道,近日,有网友在社交媒体发帖称,美团外卖骑手能屏蔽顾客了。相关页面信息显示,目前已在晋江
2025-10-14 17:08:00
华为、OPPO等国内厂商也将陆续上市eSIM手机
日前,苹果宣布iPhoneAir国行版将于10月17日早9点预购,10月22日正式发售。随后,中国移动、中国联通、中国电信三大运营商相继宣布
2025-10-14 17:49:00
无人驾驶获《时代》2025最佳发明奖:萝卜快跑、谷歌、特斯拉“三大家”全球竞速
中国青年报客户端讯(中青报·中青网记者 王军利)近日,《时代》公布2025年最佳发明榜单,无人驾驶技术赫然在列。作为人工智能在物理世界的典型应用
2025-10-14 22:56:00