• 我的订阅
  • 科技

喜马拉雅珠峰语音生成技术实现5秒极速克隆,亮相云栖大会

类别:科技 发布时间:2023-11-01 17:06:00 来源:上游新闻

喜马拉雅于2023年10月31日至11月2日亮相2023云栖大会,喜马拉雅在本次大会上展示了最新的自研语音技术成果,包括喜马拉雅珠峰语音生成式大模型和第二代智能语音交互系统,为参会者展示AIGC与文娱音频产业深度融合的最新成果。

据了解,喜马拉雅珠峰语音生成式大模型是喜马拉雅的一项创新性技术,具备快速实现语音音色和风格定制的能力。这一技术支持丰富场景下的音色实时转换,为声音赋予了创造性的“变声”能力,宛如给声音涂上不同的“画皮”。此前,喜马拉雅珠峰实验室团队已通过AIGC方式创作了超过3.7万部有声书专辑,而AIGC作品的每日播放时长已超过250万小时。

喜马拉雅珠峰语音生成技术实现5秒极速克隆,亮相云栖大会

记者在云栖大会现场看到,喜马拉雅展示了其自研的珠峰语音生成式大模型。该大模型由喜马拉雅珠峰智人团队与西北工业大学aslp lab展开合作,基于自研框架,实现音频与文本在统一框架下的稠密训练,用于语音生成任务,能够实现语音风格和音色的 zero shot 的学习和迁移,实现风格和音色的任意组合,同时,喜马拉雅基于阿里云数据湖3.0构建的云原生大数据平台为语音大模型训练提供了海量高质量数据,是喜马拉雅语音大模型不可或缺的“数据引擎”。

喜马拉雅珠峰语音生成技术实现5秒极速克隆,亮相云栖大会

据喜马拉雅首席科学家、珠峰实验室负责人卢恒介绍,“喜马拉雅语音生成式大模型目前已经取得了显著的突破,在音色定制方面实现了5秒内的‘极速克隆’声音。通过极少量的数据,该模型能够克隆出具有90%相似度的基本音色,并在短短的10秒内快速生成定制音频。未来,这项技术在短视频创作、数字人配音、人机交互对话、名人IP复刻等领域有望发挥出巨大的潜在价值,有效解决商业场景中的沟通需求痛点。”

喜马拉雅珠峰语音生成技术实现5秒极速克隆,亮相云栖大会

喜马拉雅珠峰实验室资深产品专家吕睿韬现场介绍到:该语音大模型采用基于语音向量和语义标记的新型语音编解码器,其中语音向量包含用于高保真语音重建的声学细节,而语义标记(LLM)则侧重于语言建模的语音的语言内容,最终实现高效生成最富有语言表现力和最高保真度的语音(对话)内容。应用场景上,该语音大模型可应用于语音内容生成、口语对话、语音音色实时转换、说话风格迁移、语音到语音跨语种翻译、说话人匿名化等各种任务。

据悉,喜马拉雅还将在云栖大会上展示其第二代智能语音交互系统,这一系统以阿里云的“通义千问”大模型为基础,以喜马拉雅儿童形象代言人“波波”为中心,增强了他的自然连贯对话能力,凸显了“波波”这一IP形象的特征。该智能语音交互系统已通过喜马拉雅儿童APP和喜马拉雅提供服务,波波球为家庭亲子用户提供陪伴对话功能。

上游新闻 马亮

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-11-01 18:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

喜马拉雅音频大模型亮相,AI赋能内容创作者
...引了众多前沿技术企业展示AI时代云上创新的潮流科技。喜马拉雅珠峰AI音频多模态大模型亮相云栖大会,在“人工智能+”主题馆吸引众多市民驻足围观体验。AI(人工智能)已经在深刻影
2024-09-21 09:50:00
喜马拉雅副总裁王冬梅出席CDEC:AI技术赋予创作者和主播声音的多样化可能性
...,中国国际数字娱乐产业大会(CDEC)高峰论坛首次召开,喜马拉雅副总裁王冬梅应邀参加27日“生态x趋势重构格局”板块中的圆桌论坛,与多位参会行业者交流了AI技术如何赋能文娱产
2023-07-31 16:01:00
盈利2.24亿元,能换来喜马拉雅一个上市名额?
...革””。去年,这些负面词汇还围绕在这个在线音频巨头喜马拉雅的身边。今年,喜马拉雅底色似乎变了。日前多家媒体报道称,“喜马拉雅向港交所递交招股书,高盛、摩根士丹利、中金为联席保
2024-04-18 13:58:00
喜马拉雅IPO:用AI为创作者赋能的同时构建庞大内容生态
喜马拉雅公布过一则数据,其用单田芳AI合成音制作的TTS(语音合成)专辑总播放量已经破亿。这一数据,喻示着在喜马拉雅“UGC+PGC+PUGC”内容生态之外,又多了一个AIGC的
2024-10-22 11:46:00
RTE2023开幕 声网宣布首创广播级4K超高清实时互动体验
...动技术为世界带来的改变。此外,声网首席运营官刘斌、喜马拉雅首席科学家卢恒、Soul APP技术副总裁张高政、小红书音视频架构负责人陈靖、商汤科技商务总监 数字文娱事业部副总裁
2023-10-25 13:02:00
科技创新为高质量发展赋能,助力喜马拉雅IPO
...助新兴技术不断提升内容质量,为自身高质量发展赋能。喜马拉雅作为国内领先的音频平台,不断探索新技术,以AI赋能为喜马拉雅上市提供强大技术支撑
2023-12-29 18:49:00
2023年智能眼镜再进化:低调轻便成趋势
...智能眼镜套装防蓝光可替换太阳镜片方形,一键直达3、喜马拉雅声阔智能音频眼镜价格:1199喜马拉雅声阔智能音频眼镜是一款集成了音频播放、语音助手、通话、智能语音翻译等多种功能的
2023-04-26 00:30:00
华为HarmonyOS 4,再一次改变了操作系统的「智慧」
...年内活跃用户增长了6倍,接近App的用户量。大家常用的喜马拉雅可以直接在卡片上播新闻、听故事,近半年的活跃用户增长11倍。就算是在平时,给家里缴电费也不需要打开App一步一步
2023-08-05 20:32:00
...边界,中国第一汽车集团有限公司、山东高速集团、上海喜马拉雅科技有限公司、哈啰集团等一众企业均推出前沿AI产品,涵盖工作效率、拟人交互、智能终端等多个场景,为人们生活、工作带来
2024-09-04 07:02:00
更多关于科技的资讯:
京东集团宣布成立京东美术馆,以艺术与科技链接世界
1月20日,京东集团正式宣布成立京东美术馆(JD Museum)。京东美术馆是一所当代视觉、表演艺术及文化机构,坐落于深圳湾超级总部基地
2026-01-20 13:34:00
2026 EIM 西南电子智能制造大会圆满举办
2026年1月16日,由深圳市终端电子制造产业协会、广东省电子学会SMT专委会主办,华友(重庆)企业管理咨询有限公司、EIM西南电子智能制造服务中心承办的“2026 EIM 西南
2026-01-20 11:02:00
AI赋能千行百业一线故事(二十):全程可追溯,鸡蛋有了“数字身份证”
全程可追溯,鸡蛋有了“数字身份证”——AI赋能千行百业一线故事(二十)1月16日,在邯郸百瑞可蛋品供应链管理有限公司数字蛋品交易服务中心
2026-01-20 08:20:00
山东移动以AI赋能零售,开启24小时智慧经营新时代
深夜,济宁“润佳便利店”却依旧亮着灯光,为百姓提供服务,成为一道温暖的风景线。一名刚下夜班的年轻人扫码推门,从货架间挑选饮品与零食
2026-01-20 09:48:00
任丘“链齿云”推动四百余家企业组团发展
1月14日,在任丘市的河北冀超龙传动机械公司,工作人员在“链齿云”数字化赋能平台查看公司订单。河北日报记者 戴绍志摄河北日报讯(记者戴绍志)任丘市积极探索数字化转型新路径
2026-01-20 08:18:00
张家口算力资源引来AI微短剧行业新秀
1月12日,张家口数字文创产业基地,北动漫(河北)网络科技有限公司员工在讨论人工智能项目细节。 河北日报记者 耿辉摄1月8日
2026-01-20 08:22:00
厦门网讯(厦门日报记者 李晓平)昨日,《2025胡润中国人工智能企业50强》榜单发布,聚焦全球AI(人工智能)产业创新浪潮中的中国标杆企业
2026-01-20 08:07:00
“最早来杭州是1998年,那时我还是个博士生。”白马湖畔,北京航空航天大学杭州创新研究院院长王俊的回忆闸门打开,叙述充满画面感
2026-01-20 07:09:00
中国网1月20日讯 据国家安全部消息,近期,境外一家购物中心的户外大型数字广告牌突然异常,引发业界对公共场所数字显示屏等公共数字设备潜在风险的重视
2026-01-20 07:31:00
董佳琳摘要:随着数字技术的广泛应用,数字经济已成为推动金融行业转型升级的核心引擎,尤其在金融科技创新方面,数字经济为其提供了持续的内生动力
2026-01-20 06:52:00
2026年米兰冬奥会的脚步越来越近,绍兴乾雍纺织有限公司总经理萧兴水期待着米兰来的消息。“这次咱们中国队赛时制服面料全部用数码打印而成
2026-01-19 23:33:00
河北新闻网讯(任蕊)“以前插接一根四分钢丝绳,费时费力。现在用上自制装置,效率翻番!”1月11日,在开滦股份吕家坨矿负950五采回风石门掘进现场
2026-01-19 20:15:00
一家皖企跻身胡润中国人工智能企业10强榜
大皖新闻讯 1月19日,胡润研究院发布《2025胡润中国人工智能企业50强》排行榜,中国科大校友陈天石创立的寒武纪蝉联榜首
2026-01-19 22:42:00
河北新闻网讯(田坤)近日,在开滦集团钱家营矿业公司(简称“开滦钱矿公司”)机采科检修车间,一台自主研发的“液压钻车负载敏感阀试验台装置”成功完成首次测试
2026-01-19 20:03:00
河北新闻网讯(闫丽颖、罗俊明)近日,开滦股份范各庄矿顺利完成井下排水泵房的智能化改造,传统人工巡检模式被远程集中监控替代
2026-01-19 20:04:00