• 我的订阅
  • 科技

中国电信人工智能研究院发布首个支持30种方言混说的语音大模型

类别:科技 发布时间:2024-05-27 14:51:00 来源:人民资讯

本文转自:人民日报客户端

近日,中国电信人工智能研究院(TeleAI)发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持最多方言的语音识别大模型之一。

用AI守护方言,让语言文化焕发生命力

方言是中国文化多样性的瑰宝,传承丰富的历史文化内涵;方言也是不同区域文化的灵魂,凝聚人们乡情的根源,具有丰富的人文价值,保护方言传承语言文化迫在眉睫。

AI正在为传承语言文化注入全新生命力。中国幅员辽阔,“百里不同俗,十里不同音”,各种方言语法语音特征各不相同,传统的方言研究依赖于调查者主观感知标注,人力工程量巨大且难以系统标注。而AI能够更高效、系统地对方言进行整理归纳,对方言保护和传承意义重大。

构建高质量方言数据库,是方言保护和研究的基础。当前,中国电信人工智能研究院已构建超30种,超30万小时的高质量方言数据库,方言数据库在丰富性和高质量等层面均居于业内前列。

中国电信人工智能研究院(TeleAI)坚持自主研发创新,在中国电信CTO、人工智能研究院院长李学龙带领下,推出了星辰语音大模型,通过超大规模语音预训练和多方言联合建模,率先实现单一模型支持30种方言自由混说语音识别,是国内支持最多方言、覆盖人口最多的语音大模型;研发团队首创“蒸馏+膨胀”联合训练算法,解决超大规模多场景数据集和大规模参数条件下,预训练坍缩的问题,实现1B参数80层模型稳定训练;星辰语音大模型也是业内首个开源的基于离散语音表征的语音识别大模型,通过“从语音到token再到文本”的建模新范式,将推理时语音传输比特率降低数十倍。

星辰语音大模型以优势性能,斩获多个国际权威赛事冠军。在权威国际语音顶会INTERSPEECH2024离散语音单元建模挑战赛上,凭借星辰语音识别大模型的领先技术,中国电信人工智能研究院语音团队斩获语音识别赛道冠军。在业内知名的多方言语音识别数据集KeSpeech任务上,星辰语音大模型打破纪录,领先之前最优结果20%,以高达92.97%的字准确率刷新最优结果。

勇担央企使命 搭建沟通桥梁

随着AI技术高速发展,人们享受着智能化、无人化服务的便利。中国电信坚定地承担央企责任,用AI搭建沟通的桥梁,让每一个人都能享受AI时代便利;并凭借几亿用户和丰富应用场景,推动技术更快进步,更好地服务每一个人。

目前,星辰语音大模型已在福建、江西、广西、北京、内蒙等地的中国电信万号智能客服试点应用,接入星辰大模型以后,万号智能客服秒懂30种方言,自然流畅地服务用户,实现日均处理约200万通电话;智能客服翼声平台接入星辰大模型的语音理解和分析能力,实现31省全覆盖,每天处理125万通客服电话。此外,星辰语音大模型还落地多地市的12345平台,赋能客服人员秒懂30种方言,更自然流畅理解更多市民需求,提升沟通效率,助力政务工作智能化升级,更高效、便捷地为每一位市民提供服务。

在中国国际大数据产业博览会上,星辰语音大模型让数字人“能听会说”,数字人“数数”,声音甜美生动、与康辉同台主持,中英文随意切换的,交流对话自然流畅,广受好评。

星辰语音大模型现已对外开源,携手合作伙伴及个人开发者,开发面向更多场景的应用,共同守护方言、传承语言文化,助力AI普惠。未来,中国电信人工智能研究院将持续深耕研发创新,不断提高支持方言的数量和准确度,计划建成首个覆盖全国333个地市方言和主要少数民族语言的语音识别大模型,切实让每个人都能享受到AI时代的便利。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-27 17:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...混说语音大模型。25日,在第七届数字中国建设峰会上,中国电信人工智能研究院发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破单一模型只能识
2024-05-25 20:19:00
本文转自:温州都市报温州话被AI 精准译为普通话中国电信温州分公司: 已纳入星辰语音大模型 目前处于内测阶段温都讯 “AI技术开始卷方言了吗?”昨天,温州话博主“ot老师”告诉温
2024-05-31 14:16:00
teleai星辰语音大模型:多方言能力再次突破
...,大模型的技术范式提供了天然的解决出口。今年5月,中国电信人工智能研究院(TeleAI)推出了业内首个具备超多方言识别能力的星辰语音大模型。针对人工标注方言数据稀缺的问题,T
2024-11-16 20:12:00
...大会暨人工智能全球治理高级别会议产业发展主论坛上,中国电信董事长柯瑞文作《共创共治共享人工智能产业美好未来》的主旨演讲,分享了中国电信在人工智能发展的思考与实践。柯瑞文表示,
2024-07-08 15:49:00
...调查者主观感知标注,人力工程量巨大且难以系统标注。中国电信人工智能研究院在本届峰会期间发布了业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破
2024-05-27 17:14:00
中国电信在大模型领域成功布局ai技术
近日,中国电信人工智能研究院(TeleAI)联合北京智源人工智能研究院发布全球首个单体稠密万亿参数语义模型Tele-FLM-1T,成为国内首批发布稠密万亿参数大模型的机构。作为最
2024-06-26 11:49:00
中国电信星辰AI大模型开源自研AI创新成果助推数字中国建设“正当时”
2024年1月10日,中国电信宣布,将自研星辰AI大型模型全面开源,以更好地助力客户业务的智能化升级。这一行动表明中国电信自研大型模型能力的成熟和完备,也展示了其在落地应用和拓展
2024-01-12 17:07:00
解密星辰大模型·软件工厂 软件开发迈入智能化全流程新阶段
国内运营商中,中国电信是最早布局 AI 领域的一家,从去年至今,从星辰语义大模型到星辰多模态大模型和星辰语音识别大模型,中国电信旗下大模型始终保持着快速迭代,且完成了语义、语音、
2024-07-15 19:52:00
数字熊猫“苏琳”精彩亮相首届中国数字人大会
...解,这位集“美貌与才华”于一身的熊猫界“网红”,是中国电信四川公司联合中国电信人工智能研究院以四川省阿坝州为试点打造的文旅行业3D智能数字熊猫,也是中国电信与中国互联网协会共
2024-09-25 10:44:00
更多关于科技的资讯: