• 我的订阅
  • 头条热搜
DeepSeek第二炸:开源首个用于 MoE 模型训练通信库
...出了开源代码库DeepEP王炸。据了解,DeepEP是首个用于 MoE 模型训练和推理的开源 EP 通信库,它填补了MoE模型专用通信工具的空白,为大规模分布式AI训练和实时推理场景提供了更高效的底层支持。在这里,简单介绍一下DeepEP的技...……更多
大模型新趋势之MoE:现状、挑战及研究方向
2024年,全球主流企业加快推出MoE大模型,1-5月发布千亿以上大模型均采用MoE优化架构,且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势,更适合处理大规模数据和复杂任务,已成谷歌、OpenAI、...……更多
DeepSeek,大消息
...度提升25倍,并且每token成本降低20倍的惊人成果。这一新模型的推出,标志着英伟达在人工智能领域的又一次重大进展。开源周第三天,DeepSeek宣布开源Optimized Parallelism Strategies(优化并行策略)。据悉,该策略是为了提高计算...……更多
从狂热到理性:大模型训练三堵墙,一场少数人的游戏 | 钛媒体深度
...PU卡,把服务器买走都行”。3月份开始,张阳明显感受大模型带来的冲击,作为一家云厂商算力平台负责人,他意识到市场甚至有些盲目。“当时客户比较慌,相当于对产品都没有什么要求,不关心网络和存储,就是感觉大家都...……更多
...来网络研究院”)签署战略合作框架协议。各方将围绕大模型核心技术联合攻关,力争在3-5年内实现行业大模型技术创新能力江苏领先水平,在全国具有示范意义。同时,多方合作还将共建江苏省大模型产业赋能中心,加速大模...……更多
百度智能云两大基础设施再升级!打造AI时代最开放的智能基础设施
4月25日,以“模型的世界,应用的天下”为主题的Create2025百度AI开发者大会在湖北武汉召开。会上,百度集团执行副总裁、百度智能云事业群总裁沈抖分享了百度智能云在智能基础设施建设方面的最新成果,并在算力、模型及...……更多
AI大模型“战火”从互联网烧到了手机侧,谁在提前布局?
尽管大模型算力消耗惊人,但这并没有阻止各大科技公司将AI应用于其他设备,比如智能手机。一个月内,已有多家科技厂商对AI大模型在手机上的应用作出公开表态,以自研或者合作的方式进入这一狂热的赛道。“手机上的对...……更多
中兴通讯:全栈全场景智算解决方案,助力行业智能化转型升级
...发展新质生产力注入高效算力随着人工智能迅速发展,大模型的迁移成本和开发门槛成为影响AI创新的重要因素。为此,中兴通讯推出AI训推平台(AI Studio),简化创新之路、降低迁移成本。在中兴通讯南京滨江智能制造基地,...……更多
当大模型Scaling Law继续,万卡集群算力释放在百舸找到一条通途
...一世纪什么最贵?人才!」而随着人工智能行业进入到大模型时代,这一问题的答案已然变成了「算力」。随着模型规模急剧扩张,参数已经飙升到了千亿甚至万亿级,业界开启了千模大战,AI 算力需求不可避免迎来爆炸式增长...……更多
腾讯Angel获世界互联网大会领先科技奖:让通信成本降低70%
...奖。评选委员会点评腾讯Angel机器学习平台:突破万亿级模型分布式训练和推理以及大规模应用部署等难题。据了解,突破主要在通信、效率、规模三方面实现。通信:从网卡到交换机,再到路由协议,腾讯自研的RDMA网络实现了...……更多
移远通信工业智能品牌宝维塔™及旗下核心产品、解决方案正式发布
...术高效落地「匠心」作为宝维塔™精心打造的行业AI算法模型训练平台,集成了数据上传、数据标注、模型训练、模型测试、模型发布等全流程功能,具有推理性能强大、功能丰富、高效便捷、简单易用等特点,能够为企业提供...……更多
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
实在智能RPA数字员工与浪潮信息AIStation完成适配认证
...位一体的数字员工产品体系,并结合自研垂直领域大语言模型TARS(塔斯),为客户提供“有效、安全、可信任、可落地”的“大模型+”行业解决方案。实在智能RPA数字员工能够帮助人工自动高效完成重复性高且细节繁琐的业务操作,...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
元象XVERSE发布中国最大MoE开源模型:XVERSE-MoE-A36B,该模型总参数255B,激活参数36B,达到100B模型性能的「跨级」跃升。同时训练时间减少30%,推理性能提升100%,使每token成本大幅下降。在多个权威评测中,元象MoE效果大幅超越多...……更多
王小川新公司「百川智能」发布首个开源中英文大模型,开源免费可商用 | 最前线
...氪获悉,6月15日,百川智能公司正式推出中英文预训练大模型——baichuan-7B,参数量为70亿。百川智能是搜狗创始人王小川于2023年4月成立的新AI公司,36氪此前也曾做报道。baichuan-7B则是新公司成立两月后发布的第一个大模型。据...……更多
CPU,正在被AI时代抛弃?
...对话可以通过语音识别技术被录入到病例系统中,随后大模型AI推理技术辅助进行智能总结和诊断,医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间,也保护了患者隐私;在法院、律所等业务场景中,律师通过大...……更多
《移动通信与AI融合的数据格式和模型建议书》发布 【《移动通信与AI融合的数据格式和模型建议书》发布】财联社12月22日电,中国信息通信研究院移动通信创新中心联合华为技术有限公司、中兴通讯股份有限公司、中信科移...……更多
...能够精确实时地捕捉物理世界的细微变化。通过网络数据模型和标准接口并辅以自纠错和自生成的能力,使得数据质量得到保障。此外,6G网络还需要达到Tbps的传输速率以保证精准的建模和仿真验证的数据量要求,通过快速的迭...……更多
oppo首个端侧应用70亿参数大模型findx7系列
...的首个听筒/免提双模卫星通话,首个端侧应用70亿参数大模型,首次亮相的潮汐架构等诸多前沿技术。此次宣布的全新技术组合将全面落地下一代旗舰产品FindX7系列,为2024年旗舰手机树立全新的技术标杆,并为消费者带来刷新...……更多
腾讯Angel机器学习平台获世界互联网大会领先科技奖
...年度领先科技奖。腾讯Angel 机器学习平台,突破了万亿级模型分布式训练和推理以及大规模应用部署等难题,率先实现大模型技术从底层硬件到关键软件技术的自主研发,在业务场景广泛应用,显著推动实体产业和数字经济发展...……更多
【产业互联网周报】商务部回应荷兰半导体出口管制;美团收购光年之外全部权益;人民大学通报学生信息泄露事件……
... 80486SX CPU。字节旗下火山引擎发布“火山方舟”,加速大模型应用落地在火山引擎主办、英伟达合作举办的“V-Tech体验创新科技峰会”上,火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
【新智元导读】是时候用CPU通用服务器跑千亿参数大模型了!马斯克19天建成由10万块H100串联的世界最大超算,已全力投入Grok 3的训练中。与此同时,外媒爆料称,OpenAI和微软联手打造的下一个超算集群,将由10万块GB200组成。...……更多
阿里云全面升级GPU云服务:AI大模型推理性能可提升100%
...,帮助开发者及企业更高效地开发和部署AI应用,加速大模型应用落地。随着AI大模型的体量变大、应用变广,单GPU已难以承载推理应用的全部需求,多GPU推理时代已经到来,如何在GPU资源紧缺的当下,实现GPU高效互联,是提升...……更多
平治信息:一季度净利润同增287.38%,算力业务爆发打开新增长空间
...尔线程、天数智芯、沐曦、昇腾等)完成适配,适配AI大模型应用场景的专用服务器。此外,天昕电子还在积极推进AI大模型算力应用的算力一体机研发。此外,公司积极推进与国内AI企业的深度合作。公司与北京智谱华章科技有...……更多
DeepSeek致谢腾讯技术团队:这是一次“巨大的加速”代码贡献!
...RoCE网络环境提升100%,IB网络环境提升30%,为企业开展AI大模型训练提供更高效的解决方案。该技术方案获得了DeepSeek公开致谢,称这是一次“huge speedup(巨大的加速)”代码贡献。据了解,自今年2月DeepSeek开源包括DeepEP在内的五...……更多
史上首个实时AI视频生成技术:DiT通用,速度提升10.6倍
...n-Sora、Open-Sora-Plan 和 Latte 在内的流行基于 DiT 的视频生成模型的质量。值得注意的是,作为一种不需要训练的方法,PAB 可以为任何未来基于 DiT 的视频生成模型提供加速,让其具备实时生成的能力。自今年起,OpenAI 的 Sora 和其...……更多
大模型如何链接产业?“联通元景”重磅发布!
近两年,大模型技术发展速度令人瞠目,从2020年OpenAI的GPT-3到2023年的GPT-4经历了两年多的时间,从2023年Google推出Imagen2文生图大模型到2024年2月引爆媒体的文生视频模型Sora仅间隔了2个月。而且,大模型技术的应用场景也更加广...……更多
华为NCE-数据通信领域总裁王辉:AI落地应用的新阶段
当大模型从技术奇点跃迁为产业基座,当智能体从实验室走进产线诊室,人工智能的第三次浪潮正以前所未有的锐度重构全球经济肌理。中国在这场变革中展现出双重禀赋:既是拥有超大规模应用场景的试炼场,又在芯片突围...……更多
...建设峰会期间,政、企、研多方代表,聚焦人工智能、大模型、算力、数据要素等前沿技术,在分论坛中掀起了一场关于首都智能化跃迁的“头脑风暴”。北京市经济和信息化局党组成员、副局长苏国斌指出,当前北京正加快数...……更多
...集群的建成不仅为百度带来了强大的算力支持,还推动了模型降本的趋势。在过去一年中,整个行业都在努力降低大模型的使用成本,而算力紧张是导致成本居高不下的重要因素之一。百度通过自研芯片和大规模集群的建设,不...……更多
更多关于科技的资讯:
户外品牌以技术创新,实现专业场景大众化破圈|世研消费指数品牌榜Vol.63
本次监测周期内,安踏、乔丹和李宁以1.85、1.83、1.81的综合热度位列榜单综合热度前三。图源:世研大消费指数文化符号锚定品牌情感消费升级
2025-08-27 11:10:00
悠湖湾商业综合体项目基本完工
近日,江宁区上秦淮未来科技城悠湖湾商业综合体基本完工。项目总建面约17.33万平方米,含6层裙楼与14层塔楼,裙楼将打造一站式体验空间,涵盖运动、餐饮等业态,提供多主题消费体验。
2025-08-27 07:36:00
智能制造是制造强国建设的核心赛道,更是筑牢实体经济根基的关键支撑。近年来,泰安市市场监管局将标准化作为驱动制造业高质量发展的核心引擎
2025-08-26 10:07:00
近日,山东移动淄博分公司济东数据中心再传喜讯——在第三届“华彩杯”算力大赛中区决赛中,该中心凭借卓越的绿色节能表现荣获三等奖
2025-08-26 10:25:00
本报讯 (记者 王薛淄)记者从中国香料香精化妆品工业协会获悉,2025年中国香料香精化妆品行业年会暨精品博览会(以下简称“2025CAME”)将于9月25日至27日在江苏南京扬子江国际会议中心举行
2025-08-26 10:55:00
鲁迅故里景区投诉人社交账号已无法查看
8月25日,绍兴鲁迅纪念馆公众号发文,关于“鲁迅故里景墙画面误导青少年”一事回应。近日,有位孙姓女士在社交平台发帖称“鲁迅故里景墙使用鲁迅吸烟画面
2025-08-26 10:59:00
北京机器人为何更聪明自主?
北京机器人在赛跑、足球等比赛中从跑步、踢球、跳高、跳远到场景应用,从遥控到全自主,在8月14日至17日举行的2025首届世界人形机器人运动会上
2025-08-26 11:12:00
AIGC短片《你的样子》运用人工智能技术“复原”了杨靖宇、赵尚志、赵一曼、左权、彭雪枫、张自忠等十余位抗日英烈拍摄历史照片时的鲜活模样。(技术支持:南京超级头脑信息技术责任有限公
2025-08-26 11:17:00
天籁之音,穿越时光回响,缅怀那段不朽历史。逝去的英雄与故人,面容虽模糊于岁月,但精神永存。AI技术奇迹再现,让一张张珍贵的照片重焕光彩
2025-08-26 11:19:00
北京礼品展文创区成爆款集合地
本报记者 赵 曦 □ 唐 瑞在刚刚落幕的第52届中国北京国际礼品、赠品及家庭用品展览会上,文创与玩具展区格外热闹。琳琅满目的展品中
2025-08-26 11:26:00
眼下,新的入托季、入学季正在开启,与以往不同的是,今年秋季学期起,公办幼儿园学前一年在园儿童保育教育费将被免除。具体来说
2025-08-26 11:26:00
一张小小的碳标签,正在成为撬动轻工业绿色转型的关键支点,从源头到终端系统重塑着“中国制造”的低碳竞争力。8月6日,在本报刊登《轻工行业积极推进绿色低碳循环发展战略》一文中
2025-08-26 11:27:00
贵州磷化磷镁材料在全国镁质材料发展大会受关注
日前,中国菱镁行业协会镁质材料发展大会在山东济南举办。贵州磷化集团磷美公司携磷镁产品受邀参会,并凭借其在技术研发与产品创新上的表现
2025-08-26 11:31:00
网易云音乐声明:你的隐私我守护,没有“访客记录”功能
8月25日,网易云音乐微博发文称:你的隐私我守护,网易云没有“访客记录”。近期,我们关注到网上有用户询问“在网易云浏览他人主页
2025-08-26 11:33:00
在竞争白热化的重庆房地产市场,房产中介机构如何杀出重围?仅靠门店数量与人力堆砌的粗放式扩张时代已然过去。优居重庆以其独特的平台化赋能模式和精准的差异化服务策略
2025-08-26 12:09:00