我们正处于一个信息大暴发的时代,每天都能产生数以百万计的新闻资讯!
虽然有大数据推荐,但面对海量数据,通过我们的调研发现,在一个小时的时间里,您通常无法真正有效地获取您感兴趣的资讯!
头条新闻资讯订阅,旨在帮助您收集感兴趣的资讯内容,并且在第一时间通知到您。可以有效节约您获取资讯的时间,避免错过一些关键信息。
快科技1月23日消息,据中国电信,在集团公司统一组织下,中国电信研究院、天翼云、北京电信成功了 完成业内首个1024卡、千亿参数商用大模型的分布式联合训练真实用户试商用。
通过天津市武清区到北京市大兴区瀛海镇之间的真实光路环回,实现了500公里长距互联分布式训练,而且训练性能达到单数据中心的97%以上。
本次试商用基于北京现网800G广域智联无损网络,以及息壤一站式智算服务平台,在互联距离、带宽收敛比、模型参数方面,都去取得了重大突破,实现了多数据中心互联、资源整合支持商用模型分布式联合训练。
在广域智联无损网络技术方面,中国电信创新广域无损调度算法、关键帧识别技术,将带宽收敛比提升到32:1;创新WSON 50ms极速倒换技术,实现长距链路中断无感知切换。
系列技术有效解决了长距离传输中网络拥塞丢包、链路故障、建网成本等问题,确保了训练过程的稳定性和高效性。
在500公里的长距离传输下,网络传输吞吐率仍能保持在较高水平,为千卡千亿参数商用大模型的联合训练提供了坚实的网络支撑。
与此同时,息壤平台支持算力插件、跨地域算网协同、跨数据中心自动并行、断点续训等一系列关键技术能力,实现故障秒级定位、分钟级处理与恢复,保证了百川千亿参数商用模型的快速部署和稳定高效运行。
【本文结束】如需转载请务必注明出处:快科技
责任编辑:上方文Q
文章内容举报
以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。
快照生成时间:2025-01-23 17:45:07
本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。
信息原文地址: