• 我的订阅
  • 科技

重磅!TeleAI 完成首个全国产化万卡万参大模型训练

类别:科技 发布时间:2024-09-30 09:50:00 来源:机器之心Pro

近日,中国电信人工智能研究院(TeleAI)成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型(万卡万参),并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型 TeleChat2-115B。

这是由中国电信集团 CTO、首席科学家、中国电信人工智能研究院(TeleAI)院长李学龙教授带领团队完成的又一项里程碑式的重要科研成果,标志着国产大模型训练真正实现全国产化替代,正式进入全国产自主创新、安全可控的新阶段。

TeleChat2-115B 基于中国电信自研的天翼云“息壤一体化智算服务平台”和人工智能公司“星海 AI 平台”训练完成,在保证训练精度的前提下利用多种优化手段提升模型训练效率和稳定性,实现了 GPU 同等算力计算效率的 93% 以上,同时模型有效训练时长占比达到 98% 以上。

重磅!TeleAI 完成首个全国产化万卡万参大模型训练

TeleChat-52B在OpenCampass推理榜单排名第一

在今年5月的 OpenCampass 测试榜单中,TeleChat 系列模型的逻辑推理能力名列开源大模型榜单第一。作为新一代版本,TeleChat2-115B 在9月最新公布的 C-Eval 评测 Open Access 模型综合榜单中,以 86.9 分的成绩排名第一。其通用能力较 TeleChat 系列模型提升近 30%,特别是在工具使用、逻辑推理、数学计算、代码生成和长文写作等方面能力均有大幅提升。

重磅!TeleAI 完成首个全国产化万卡万参大模型训练

TeleChat2-115B在C-Eval的Open Access模型综合榜单排名第一

TeleChat2在模型训练与数据构建方面的研究经验

针对超大参数模型训练,TeleAI 采用了大量小模型进行 Scaling,进而验证不同模型结构的有效性。同时,在数据配比方面,基于小模型实验结果反馈,采用回归预测模型,得到较优数据配比。

基于以上策略,能够大幅提升大参数模型最优方案的搜寻效率。另外,在后训练退火阶段,TeleAI 通过大量实验验证探索到了退火最佳数据量和最佳配比,以及学习率变化方式等,进一步提升了模型训练效果。

在 Post-Training(后训练)方面,TeleAI 首先针对数学、代码和逻辑推理等内容合成了大量问答数据,用于 SFT(监督式微调)第一阶段模型训练。其次采用迭代式更新策略,使用模型对 Prompt(提示词)数据进行指令复杂性提升与多样性扩充,通过模型合成和人工标注提升答案质量,并利用拒绝采样获取优质 SFT 数据及 RM(奖励模型)代表性数据,用于 SFT 训练和 DPO(偏好对齐)训练,以及模型效果迭代。

TeleAI自研语义大模型获多项权威赛事第一名

连获中国计算语言学大会(CCL2024)挑战赛两项冠军:TeleAI 在 CCL2024 大会上获得中文空间语义理解评测和古文历史事件类型抽取评测两项第一名。其中,在古文历史事件类型抽取评测任务挑战赛中,更是在所有子任务均取得第一名的情况下获得了综合排名第一。

NLPCC2024 中文议论文挖掘(Shared Task5)挑战赛冠军:TeleAI语义团队基于上下文学习策略对大模型进行优化,通过利用从粗粒度到细粒度的 Prompt 设计、多模型的投票机制等手段,进一步提高了模型准确率和鲁棒性,最终以领先第二名将近 3 分的绝对优势排名第一。

开源共享,引领创新

TeleChat2-115B 的开源标志着大模型国产化迈进了又一个新征程。作为最早布局并首先开源大模型的央企机构,TeleAI 积极通过开源推动大模型技术的不断进步,并持续推动和引领技术创新向产业落地快速跃迁。

开源地址:

GitHub:https://github.com/Tele-AI/TeleChat2 Gitee:https://gitee.com/Tele-AI/tele-chat2 Modescope:https://modelscope.cn/models/TeleAI/TeleChat2-115B Modelers:https://modelers.cn/models/TeleAI/TeleChat2-115B

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-30 11:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
作者 | ZeR0编辑 | 漠影“AI主战场,万卡是最低标配!”在2024世界人工智能大会开幕前夕,摩尔线程创始人兼CEO张建中抛出一句掷地有声的断言。为什么必须是万卡?大模型行
2024-07-09 09:47:00
首个国产单池万卡液冷算力集群投入运营,满足万亿级大模型训练需求
天翼云上海临港国产万卡算力池正式启用。3月22日,中国电信宣布,天翼云上海临港国产万卡算力池正式启用,同时入驻首批用户。这是国内首个投入正式运营的国产单池万卡液冷算力集群,也是业
2024-03-23 09:09:00
张云泉:集中力量,促进国产AI大模型发展
...上升。目前,国内尚未有一家AI芯片公司的产品能够支持万卡并行大模型训练,更不用说未来的十万卡、百万卡甚至千万卡并行的挑战。其次,大模型落地所需要的配套软件、服务生态及市场缺乏
2024-09-03 14:17:00
马斯克宣布训练“世界上最强大的人工智能” !万卡集群背后的算力竞赛迅猛升级
...重要里程碑,可能会引领AI训练和推理的新趋势。 2国内万卡集群已蔚然成风金融投资报记者注意到,在国内,字节跳动、阿里巴巴、百度、科大讯飞等也都在积极推动万卡集群的建设。比如
2024-07-24 14:02:00
近日,百度智能云成功点亮昆仑芯三代万卡集群,这也是国内首个正式点亮的自研万卡集群。据悉,百度智能云将进一步点亮3万卡集群。这一重大突破标志着百度在人工智能算力领域迈出了坚实的一步
2025-02-05 11:06:00
...传出“数据荒”的问题。经过两年的发展,汇聚了大规模万卡,甚至十万卡、五十万卡规模智算集群的算力,大模型并没有取得脱胎换骨级别的提升,还因为对抗性机器学习、对训练产生的冗余数据
2024-12-30 06:40:00
摩尔线程万卡GPU集群新进展!性能可提升20倍
...活且高效的基础设施支持。摩尔线程近期宣布了从千卡至万卡的全功能GPU智算集群扩展方案,双方此番合作就将聚焦于万卡级超大规模GPU智算集群的开发与优化。清程极智是一家致力于构建
2024-07-18 22:51:00
全国首个国产液冷万卡算力集群启动建设:总算力超4500P!
...到达15000卡,总算力超4500P。其中,单池新建国产算力达万卡,是国内首个超大规模国产算力液冷集群。该集群采用新一代国产AI算力,实现了全栈自主创新和技术突破,通过高速R
2024-01-23 19:28:00
从0到1:国产化千卡集群的一小步,AI算力主动权的一大步
...千亿到万亿,所需的数据量也从几百B跃升到P级,千卡、万卡集群正日益成为大模型训练的标配。显而易见,要想走出多重因素叠加造成的国内算力紧缺困境,通过集群互联弥补单卡性能不足,也
2024-04-28 11:52:00
更多关于科技的资讯:
为切实履行金融机构反洗钱义务,富德生命人寿曹妃甸支公司创新宣传形式,将反洗钱知识融入客户服务全过程,取得了良好成效。在曹妃甸支公司服务大厅内
2025-11-17 10:19:00
近日,富德生命人寿涉县支公司的保险代理人带着精心准备的生日礼物,前往VIP客户家中慰问。这不仅是一场简单的生日拜访,更是富德生命人寿长期坚持“以客户为中心
2025-11-17 10:15:00
奋进的河北·“十四五”答卷丨身边的“十四五”(一):上下楼里的“上下游”
雄安新区之新,贵在创新,成在创新。“十四五”期间,雄安新区建成科创中心、中关村科技园等一批创新平台载体,智能网联、空天信息
2025-11-17 08:09:00
在山西焦煤西山煤电官地矿深邃的井下巷道中,23602工作面的转载机正以平稳强劲的动力输送着乌金。与以往不同的是,驱动这台关键设备的“心脏”已完成全新升级——沿用多年的传统“磁力启动器驱动”革新为“变频器驱动”
2025-11-17 07:09:00
厦门网讯(厦门日报记者 林露虹)电子数据取证领域的顶尖人才齐聚厦门,以赛促训强本领。昨日,“美亚杯”第十一届中国电子数据取证大赛(以下简称“美亚杯”)在厦门举行
2025-11-16 08:34:00
“原子级制造:前沿与应用”自然国际会议在宁举行操控原子可“按需造物”,南京已“先行一步”□南京日报/紫金山新闻记者张安琪11月11日至14日
2025-11-16 08:43:00
谁说养老只能慢节奏?记者带您解锁雄安颐养・智慧养老展示馆,三大科技彩蛋让你忍不住竖起大拇指!彩蛋1:AI健康管理机器人
2025-11-16 14:45:00
“先导杯”决赛在合肥打响 全国大学生比拼“智能计算”
大皖新闻讯 AI正在加速改变世界,但其根基仍在“算”。11月15日-16日,2025全国大学生计算机系统能力大赛——智能计算创新设计赛(先导杯)线下决赛及颁奖典礼在合肥举行
2025-11-16 14:46:00
从好房子到好生活:海尔智家以智慧重新定义未来人居
《晏子春秋》云:“君子居必择居,游必择士。”安居乐业,始终是中国人最朴素的向往。过去,一处遮风避雨的“安身之所”已是百姓慰藉
2025-11-16 15:16:00
海尔智慧家庭与小度达成全面战略合作
当智能家居行业从各自分散走向共创融合,一场新的家庭生活变革正在悄然发生。11月13日,百度世界2025于北京召开。现场
2025-11-16 15:18:00
张宣科技金属制品公司研发锌铝镁合金新产品
河北新闻网讯(董佳倩)近日,在张宣科技金属制品公司镀锌丝厂房里,一根根钢丝平稳浸入锌锅,然后裹着“银装”出锅上行,穿越配药箱之后
2025-11-16 16:19:00
东南网11月16日讯(本网记者 卢金福)随着AI技术的普及,电商平台上AI展示商品的现象日益增多。AI模特穿AI衣服做AI直播
2025-11-16 22:09:00
海尔智慧家庭与小度战略合作:双向控制,生态互通
伴随市场需求从单品向全屋智能深入,智能家居生态正从过去单一入口向着多入口、多圈层的生态体系迈进。特别是互联平台的兼容性方面
2025-11-16 15:16:00
摘要:本文围绕企业绩效管理体系的构建与完善展开研究,首先明确该体系的核心构成,包含目标设定、过程监控、评估实施与结果应用四个相互衔接的环节
2025-11-15 05:22:00
厦门软件园健康马拉松赛开跑 引入AI陪跑员
厦门网讯(厦门日报记者 林露虹 摄影报道)“我的‘跑友’是机器人!”昨日,厦门软件园第十七届健康马拉松赛在软件园二期热力开跑
2025-11-15 08:20:00