• 我的订阅
  • 头条热搜
DeepSeek第二炸:开源首个用于 MoE 模型训练通信库
...出了开源代码库DeepEP王炸。据了解,DeepEP是首个用于 MoE 模型训练和推理的开源 EP 通信库,它填补了MoE模型专用通信工具的空白,为大规模分布式AI训练和实时推理场景提供了更高效的底层支持。在这里,简单介绍一下DeepEP的技...……更多
大模型新趋势之MoE:现状、挑战及研究方向
2024年,全球主流企业加快推出MoE大模型,1-5月发布千亿以上大模型均采用MoE优化架构,且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势,更适合处理大规模数据和复杂任务,已成谷歌、OpenAI、...……更多
DeepSeek,大消息
...度提升25倍,并且每token成本降低20倍的惊人成果。这一新模型的推出,标志着英伟达在人工智能领域的又一次重大进展。开源周第三天,DeepSeek宣布开源Optimized Parallelism Strategies(优化并行策略)。据悉,该策略是为了提高计算...……更多
百度智能云两大基础设施再升级!打造AI时代最开放的智能基础设施
4月25日,以“模型的世界,应用的天下”为主题的Create2025百度AI开发者大会在湖北武汉召开。会上,百度集团执行副总裁、百度智能云事业群总裁沈抖分享了百度智能云在智能基础设施建设方面的最新成果,并在算力、模型及...……更多
中兴通讯:全栈全场景智算解决方案,助力行业智能化转型升级
...发展新质生产力注入高效算力随着人工智能迅速发展,大模型的迁移成本和开发门槛成为影响AI创新的重要因素。为此,中兴通讯推出AI训推平台(AI Studio),简化创新之路、降低迁移成本。在中兴通讯南京滨江智能制造基地,...……更多
当大模型Scaling Law继续,万卡集群算力释放在百舸找到一条通途
...一世纪什么最贵?人才!」而随着人工智能行业进入到大模型时代,这一问题的答案已然变成了「算力」。随着模型规模急剧扩张,参数已经飙升到了千亿甚至万亿级,业界开启了千模大战,AI 算力需求不可避免迎来爆炸式增长...……更多
腾讯Angel获世界互联网大会领先科技奖:让通信成本降低70%
...奖。评选委员会点评腾讯Angel机器学习平台:突破万亿级模型分布式训练和推理以及大规模应用部署等难题。据了解,突破主要在通信、效率、规模三方面实现。通信:从网卡到交换机,再到路由协议,腾讯自研的RDMA网络实现了...……更多
移远通信工业智能品牌宝维塔™及旗下核心产品、解决方案正式发布
...术高效落地「匠心」作为宝维塔™精心打造的行业AI算法模型训练平台,集成了数据上传、数据标注、模型训练、模型测试、模型发布等全流程功能,具有推理性能强大、功能丰富、高效便捷、简单易用等特点,能够为企业提供...……更多
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
元象XVERSE发布中国最大MoE开源模型:XVERSE-MoE-A36B,该模型总参数255B,激活参数36B,达到100B模型性能的「跨级」跃升。同时训练时间减少30%,推理性能提升100%,使每token成本大幅下降。在多个权威评测中,元象MoE效果大幅超越多...……更多
CPU,正在被AI时代抛弃?
...对话可以通过语音识别技术被录入到病例系统中,随后大模型AI推理技术辅助进行智能总结和诊断,医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间,也保护了患者隐私;在法院、律所等业务场景中,律师通过大...……更多
《移动通信与AI融合的数据格式和模型建议书》发布 【《移动通信与AI融合的数据格式和模型建议书》发布】财联社12月22日电,中国信息通信研究院移动通信创新中心联合华为技术有限公司、中兴通讯股份有限公司、中信科移...……更多
...能够精确实时地捕捉物理世界的细微变化。通过网络数据模型和标准接口并辅以自纠错和自生成的能力,使得数据质量得到保障。此外,6G网络还需要达到Tbps的传输速率以保证精准的建模和仿真验证的数据量要求,通过快速的迭...……更多
oppo首个端侧应用70亿参数大模型findx7系列
...的首个听筒/免提双模卫星通话,首个端侧应用70亿参数大模型,首次亮相的潮汐架构等诸多前沿技术。此次宣布的全新技术组合将全面落地下一代旗舰产品FindX7系列,为2024年旗舰手机树立全新的技术标杆,并为消费者带来刷新...……更多
腾讯Angel机器学习平台获世界互联网大会领先科技奖
...年度领先科技奖。腾讯Angel 机器学习平台,突破了万亿级模型分布式训练和推理以及大规模应用部署等难题,率先实现大模型技术从底层硬件到关键软件技术的自主研发,在业务场景广泛应用,显著推动实体产业和数字经济发展...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
【新智元导读】是时候用CPU通用服务器跑千亿参数大模型了!马斯克19天建成由10万块H100串联的世界最大超算,已全力投入Grok 3的训练中。与此同时,外媒爆料称,OpenAI和微软联手打造的下一个超算集群,将由10万块GB200组成。...……更多
阿里云全面升级GPU云服务:AI大模型推理性能可提升100%
...,帮助开发者及企业更高效地开发和部署AI应用,加速大模型应用落地。随着AI大模型的体量变大、应用变广,单GPU已难以承载推理应用的全部需求,多GPU推理时代已经到来,如何在GPU资源紧缺的当下,实现GPU高效互联,是提升...……更多
...真正意义上的“政策+产业”共振。事件驱动 DeepSeek线上模型版本升级至V3.18月 21日 ,DeepSeek发 布 了DeepSeek—V3.1大模型。本次升级后的模型采用了混合推理架构,即一个模型同时支持思考模式与非思考模式,用户可以使用“深度...……更多
平治信息:一季度净利润同增287.38%,算力业务爆发打开新增长空间
...尔线程、天数智芯、沐曦、昇腾等)完成适配,适配AI大模型应用场景的专用服务器。此外,天昕电子还在积极推进AI大模型算力应用的算力一体机研发。此外,公司积极推进与国内AI企业的深度合作。公司与北京智谱华章科技有...……更多
DeepSeek致谢腾讯技术团队:这是一次“巨大的加速”代码贡献!
...RoCE网络环境提升100%,IB网络环境提升30%,为企业开展AI大模型训练提供更高效的解决方案。该技术方案获得了DeepSeek公开致谢,称这是一次“huge speedup(巨大的加速)”代码贡献。据了解,自今年2月DeepSeek开源包括DeepEP在内的五...……更多
史上首个实时AI视频生成技术:DiT通用,速度提升10.6倍
...n-Sora、Open-Sora-Plan 和 Latte 在内的流行基于 DiT 的视频生成模型的质量。值得注意的是,作为一种不需要训练的方法,PAB 可以为任何未来基于 DiT 的视频生成模型提供加速,让其具备实时生成的能力。自今年起,OpenAI 的 Sora 和其...……更多
DeepSeek“点燃”国产芯片 FP8能否引领行业新标准?
《科创板日报》8月24日讯(记者 张洋洋)国产大模型企业DeepSeek“点燃”资本市场。近日,DeepSeek宣布其新一代模型DeepSeek-V3.1采用了UE8M0 FP8 Scale参数精度,并明确指出该精度标准是针对即将发布的下一代国产芯片设计。这一消...……更多
大模型如何链接产业?“联通元景”重磅发布!
近两年,大模型技术发展速度令人瞠目,从2020年OpenAI的GPT-3到2023年的GPT-4经历了两年多的时间,从2023年Google推出Imagen2文生图大模型到2024年2月引爆媒体的文生视频模型Sora仅间隔了2个月。而且,大模型技术的应用场景也更加广...……更多
华为NCE-数据通信领域总裁王辉:AI落地应用的新阶段
当大模型从技术奇点跃迁为产业基座,当智能体从实验室走进产线诊室,人工智能的第三次浪潮正以前所未有的锐度重构全球经济肌理。中国在这场变革中展现出双重禀赋:既是拥有超大规模应用场景的试炼场,又在芯片突围...……更多
...建设峰会期间,政、企、研多方代表,聚焦人工智能、大模型、算力、数据要素等前沿技术,在分论坛中掀起了一场关于首都智能化跃迁的“头脑风暴”。北京市经济和信息化局党组成员、副局长苏国斌指出,当前北京正加快数...……更多
...集群的建成不仅为百度带来了强大的算力支持,还推动了模型降本的趋势。在过去一年中,整个行业都在努力降低大模型的使用成本,而算力紧张是导致成本居高不下的重要因素之一。百度通过自研芯片和大规模集群的建设,不...……更多
聚焦2024数博会|广州数科集团三大展区亮相
...集团展区:共筑数字新生态广州数据集团携自主研发的大模型开放服务平台、公共数据运营平台及数字广州创新实验室精彩亮相。大模型开放服务平台集成超150种开源大模型,具备场景丰富、开箱即用、全套国产、适配信创等特...……更多
商汤大装置发布基于DeepLink的异构混合调度方案,加速国产算力从“可用”迈向“好用”
...行可靠性,加速国产AI算力从“可用”迈向“好用”,为大模型训练提供强大而高效的支撑能力。活动现场,商汤大装置事业群产品总经理卢国强和上海人工智能实验室DeepLink高级解决方案专家王峰在WAIC UP魔盒直播间进行解读,详细介...……更多
石油巨头牵手DeepSeek
昆仑大模型正式“牵手”DeepSeek2月8日,中国石油昆仑大模型正式完成DeepSeek大模型私有化部署,为昆仑大模型优化应用效果、缩短研发周期、构建健康生态提供了新引擎,推动“数智中国石油”建设步入快车道。在应用层面,...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
5月6日 记者获悉,国内权威的大模型评测机构SuperCLUE最新发布了《中文大模型基准测评2024年度4月报告》。其中,腾讯混元大模型位列国内大模型第一梯队,在基础和场景应用上均处于领先位置,位于卓越领导者象限。SuperCLUE是...……更多
更多关于科技的资讯:
【宅男财经|专家面对面】人工智能全面融入人类的生活,还有多久能够实现?工业和信息化部电子科技委主任王江平12月16日接受宅男财经采访时表示
2025-12-16 16:52:00
《科学智能生态报告》于腾冲科学家论坛发布——我国科学智能生态培育取得6项进展
12月5日至8日,由云南省人民政府和中国科学技术协会共同主办的2025腾冲科学家论坛在腾冲举行。论坛期间上海财经大学数字经济研究院与新华网融媒体未来研究院在“未来之问”可持续发展
2025-12-16 15:20:00
6.5折、每日5张!第九届雪博会优惠力度拉满了
12月18日至22日,第九届吉林冰雪产业国际博览会将在长春东北亚国际博览中心盛大启幕,以“购物最低享6.5折+1亿元冰雪消费券+企业特惠”等多重福利组合拳
2025-12-16 16:06:00
借势“疯狂动物城”热潮,叮当快药携手百多邦开启家庭健康新“城”事
伴随动画电影《疯狂动物城2》11月26日起全球热映,叮当健康旗下专业送药平台叮当快药与皮肤健康专业品牌百多邦,开展了一场覆盖线上线下的深度跨界合作
2025-12-16 14:03:00
从濒临倒闭到业绩暴增!“沸点计划”成功模型引爆区域代理签约潮
“沸点计划”上海合生汇店以一组硬核数据印证了其商业模型的爆发力:单日营业额最高突破6万元,平均翻台率稳定在5轮,远超行业平均水平
2025-12-16 14:04:00
中国消费者报南宁讯(杨霞 记者顾艳伟)知识产权纠纷曾是不少“出海”企业面临的难题。12月12日,记者从广西壮族自治区桂林市市场监管局了解到
2025-12-16 11:07:00
河北沧州:一张操作指南卡破解企业信息填报难题
中国消费者报石家庄讯(谭鑫 记者李建)记者近日从河北省沧州市标准化所获悉,今年以来,该所紧扣行风建设,以“群众易懂、流程畅通
2025-12-16 11:07:00
江苏省消保委调查货运平台发现:价格不透明、信息掺水、服务保障差等乱象突出
中国消费者报报道(记者薛晶晶)随着网络货运市场规模持续扩容,相关平台已成为货主发货、司机找活的核心渠道,但其背后的乱象也让消费者苦不堪言
2025-12-16 11:07:00
中国消费者报报道(记者李燕京)12月8日,《疯狂动物城2》在中国内地的票房突破30亿元。数据显示,截至11月30日,2025年度国产片票房已达403
2025-12-16 11:07:00
中国消费者报报道(记者桑雪骐)中央经济工作会议12月10日至11日在北京举行。在部署明年重点任务时,会议提到了“优化‘两新’政策实施”
2025-12-16 11:07:00
海尔集团与歌尔集团达成战略合作,新时达将助力歌尔深化智能制造领域布局
12月11日,海尔集团与歌尔集团正式签署战略合作协议,双方将聚焦智能家电、工业互联网、新能源及人工智能等领域展开深度合作
2025-12-16 11:33:00
于琛刚刚过去的这个“双十二”,除了各电商平台推出的促销活动,抖音出台严打“假揭黑真带货”等违规行为的多项举措,也成为人们热议的话题
2025-12-16 11:02:00
近日,全国首家“现代骑手学院”正式揭牌,该学院设在广州职业技术大学,为在职外卖骑手和快递员提供学历和技能“双提升”通道
2025-12-16 08:07:00
12月12日“双十二”购物节当天,西湖区黄龙国际中心K-lab广场人气高涨,“疯狂碰友日·西湖首发季”2025西湖区新消费活动在此启动
2025-12-16 08:30:00
为加快培养适应人工智能时代发展需求的高水平创新人才,10月底,《浙江省中小学人工智能通识教育指导意见》发布。此前,杭州将人工智能通识课程纳入中小学各学段地方课程
2025-12-16 08:31:00