• 我的订阅
  • 科技

语音能力再突破!讯飞星火语音大模型即将发布

类别:科技 发布时间:2024-01-29 15:57:00 来源:齐鲁晚报齐鲁壹点

记者 刘阿龙

人工智能快速发展催生语音合成技术不断成熟,让机器不仅能“开口说话”,还能“谈心交心”,在语音技术的突破下,人机交互将迎来新的发展阶段。1月30日,讯飞星火认知大模型V3.5升级发布会即将举行,会上将同步发布讯飞星火语音大模型, 此外还将发布开源大模型等。

2023年5月6日,科大讯飞正式发布了讯飞星火认知大模型,可以基于自然对话方式完成用户需求理解与任务执行。它还能支持“语音输入”及“语音播报”功能,可以实现对文本内容的朗读和纯享语音对话,这两项功能丰富了大模型的交互方式,拓宽了其场景应用的边界。

自首发以来,星火认知大模型经历V1.5版本的迭代,于去年8月15日如期迎来V2.0版本,对代码能力进行了代码生成、代码补齐、代码纠错、代码解释、单元测试生成5个维度升级,其多模态能力的升级具体体现在图像描述、图像问答、识图创作等多个维度。

语音能力再突破!讯飞星火语音大模型即将发布

去年10月24日,在第六届世界声博会暨2023科大讯飞全球1024开发者节的主论坛上,星火认知大模型V3.0正式发布,从文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力方面都有了持续的提升。星火V3.0进一步升级了多模态指令跟随与细节表达等能力,实现从多轮对话、主动对话再到启发式对话的跨越。

作为首个基于全国产化算力平台训练的全民开放大模型,讯飞星火认知大模型V3.5将打造更实用、更通用的大模型底座。据了解,1月30日,讯飞星火认知大模型V3.5发布会上将公布在语音能力方面实现的重要突破。

科大讯飞从语音起家,多年来在语音识别、语音合成、声音事件检测等多个领域始终保持源头核心技术创新迭代,并收获多项相关国际权威赛事和评测冠军。语音识别方面,科大讯飞继2016年参与以来,连续四届在国际多通道语音分离与识别大赛CHiME夺冠,领跑国际竞争对手;语音合成方面,科大讯飞获国际语音合成大赛Blizzard Challenge十四连冠,屡次在自然度、相似度等指标上打破纪录;在声音事件检测上,科大讯飞获2020、2022和2023年国际声学场景和事件检测及分类挑战赛DCASE多项冠军,展现了在智能音频技术领域的不俗实力。

持续技术创新的同时,科大讯飞也将智能语音技术赋能教育、医疗、金融、汽车、工业等多个行业领域,科大讯飞在不断推动智能语音技术革新的同时,也积极拓展其应用范围,与各行各业深度融合,为用户带来更加丰富和便捷的交互体验。不久前,科大讯飞在国际车载多通道语音识别挑战赛中取得ASR和ASDR两个赛道的第一名,相关技术已经在车载领域落地应用,有效提升了车内语音识别准确率,让车上多个位置的乘客与语音助手交互实现互不干扰,充分展现了新技术赋能行业新变革的重要价值。

从2021年语音云平台问世和讯飞输入法上线语音输入,到讯飞翻译机、AI学习机、录音笔、办公本等产品的不断推动,科大讯飞智能语音技术也已深入赋能到C端产品,服务更多用户,为工作、学习、生活提高效率,提供便利。

结合大模型底座,此次即将发布的语音大模型也将带来语音方面的多项技术创新升级和应用体验。智能语音是万物互联机器沟通的入口,语音大模型的发布也将推动全新人机交互变革,带来更便捷的语音交互和更广的语言互通。

投身于通用人工智能技术浪潮,科大讯飞始终以自主创新推动每一次技术跃迁。本次发布的星火语音大模型将以全球领先的主流语种能力,引领万物互联时代的人机交互革命。期待在大模型技术革新浪潮下,语音能力会实现更高的突破,未来将与多领域进行深度融合,持续赋能更多产品落地,实现多语种和个性化的全面提升。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-01-29 17:45:14

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

星火语音大模型由多语种语音合成
1月30日消息,星火语音大模型首次发布。据了解,星火语音大模型由多语种语音合成,在首批37个主流语种上已整体超越OpenAI公司推出的Whisper-large-v3
2024-01-31 02:18:00
端到端同传国内首个!科大讯飞星火同传语音大模型发布:领先Gemini 2.0、GPT-4o
快科技1月15日消息,今日,科大讯飞星火同传语音大模型正式发布,这是国内首个具备端到端语音同传能力的大模型。相较于讯飞此前的翻译技术,该模型在全场景下的翻译效果提大幅提升,端到端
2025-01-15 10:54:00
科大讯飞星火语音大模型正式发布
...升,数学、语言理解、语音交互能力超GPT-4Turbo;星火语音大模型正式发布,首批37个主流语种效果超过OpenAIWhisperV3
2024-02-01 10:07:00
讯飞星火V4.0整体超越GPT-4 Turbo,8个国际权威测试集测评第一
...,获得国家科学技术进步奖一等奖。发布会现场,星火语音大模型迎来新突破。面向万物互联时代,本次星火语音大模型发布国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37
2024-06-28 08:49:00
全国产算力平台“飞星一号”的首个成果发布:讯飞星火V3.5来了
...等“打工神器”获得台下一阵掌声点赞。正式发布星火语音大模型“大模型带来了语音技术发展的全新机会。”刘庆峰强调,让机器具备学习、推理和决策的能力,就是认知大模型要干的主要工作。
2024-01-30 22:41:00
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...布新升级的讯飞认知大模型星火V3.5,并发布了自研的语音大模型,以及星火开源大模型——星火开源-13B。过去一年,科大讯飞的重点都在大模型方向上,临近岁末放出大量更新,某种程
2024-01-31 07:32:00
国家科学技术进步一等奖,为何给了这家AI国家队
...1月30日,科大讯飞就基于上述技术融合路线发布了星火语音大模型,显著超过了OpenAI的Whisper v3的语音大模型能力
2024-06-25 09:30:00
科大讯飞构建全新语音建模框架 降低AI声音复刻门槛
...自然、语气连贯。此次讯飞技术突破的关键,除了星火语音大模型底座的基础和持续迭代,还构建了一套三阶段层次化语音建模框架。首先,通过星火底座大模型精确捕捉发音规律和韵律特征。其次
2025-06-27 17:52:00
科大讯飞多语种技术,提供超1亿分钟公益服务
...语种冠军及7个语种非受限赛道冠军;2024年,讯飞星火语音大模型的首批37个主流语种的语音识别效果超过OpenAI最新语音大模型Whisper V3
2024-05-08 15:08:00
更多关于科技的资讯:
2026 EIM 西南电子智能制造大会圆满举办
2026年1月16日,由深圳市终端电子制造产业协会、广东省电子学会SMT专委会主办,华友(重庆)企业管理咨询有限公司、EIM西南电子智能制造服务中心承办的“2026 EIM 西南
2026-01-20 11:02:00
AI赋能千行百业一线故事(二十):全程可追溯,鸡蛋有了“数字身份证”
全程可追溯,鸡蛋有了“数字身份证”——AI赋能千行百业一线故事(二十)1月16日,在邯郸百瑞可蛋品供应链管理有限公司数字蛋品交易服务中心
2026-01-20 08:20:00
山东移动以AI赋能零售,开启24小时智慧经营新时代
深夜,济宁“润佳便利店”却依旧亮着灯光,为百姓提供服务,成为一道温暖的风景线。一名刚下夜班的年轻人扫码推门,从货架间挑选饮品与零食
2026-01-20 09:48:00
任丘“链齿云”推动四百余家企业组团发展
1月14日,在任丘市的河北冀超龙传动机械公司,工作人员在“链齿云”数字化赋能平台查看公司订单。河北日报记者 戴绍志摄河北日报讯(记者戴绍志)任丘市积极探索数字化转型新路径
2026-01-20 08:18:00
张家口算力资源引来AI微短剧行业新秀
1月12日,张家口数字文创产业基地,北动漫(河北)网络科技有限公司员工在讨论人工智能项目细节。 河北日报记者 耿辉摄1月8日
2026-01-20 08:22:00
厦门网讯(厦门日报记者 李晓平)昨日,《2025胡润中国人工智能企业50强》榜单发布,聚焦全球AI(人工智能)产业创新浪潮中的中国标杆企业
2026-01-20 08:07:00
“最早来杭州是1998年,那时我还是个博士生。”白马湖畔,北京航空航天大学杭州创新研究院院长王俊的回忆闸门打开,叙述充满画面感
2026-01-20 07:09:00
中国网1月20日讯 据国家安全部消息,近期,境外一家购物中心的户外大型数字广告牌突然异常,引发业界对公共场所数字显示屏等公共数字设备潜在风险的重视
2026-01-20 07:31:00
董佳琳摘要:随着数字技术的广泛应用,数字经济已成为推动金融行业转型升级的核心引擎,尤其在金融科技创新方面,数字经济为其提供了持续的内生动力
2026-01-20 06:52:00
2026年米兰冬奥会的脚步越来越近,绍兴乾雍纺织有限公司总经理萧兴水期待着米兰来的消息。“这次咱们中国队赛时制服面料全部用数码打印而成
2026-01-19 23:33:00
河北新闻网讯(任蕊)“以前插接一根四分钢丝绳,费时费力。现在用上自制装置,效率翻番!”1月11日,在开滦股份吕家坨矿负950五采回风石门掘进现场
2026-01-19 20:15:00
一家皖企跻身胡润中国人工智能企业10强榜
大皖新闻讯 1月19日,胡润研究院发布《2025胡润中国人工智能企业50强》排行榜,中国科大校友陈天石创立的寒武纪蝉联榜首
2026-01-19 22:42:00
河北新闻网讯(田坤)近日,在开滦集团钱家营矿业公司(简称“开滦钱矿公司”)机采科检修车间,一台自主研发的“液压钻车负载敏感阀试验台装置”成功完成首次测试
2026-01-19 20:03:00
河北新闻网讯(闫丽颖、罗俊明)近日,开滦股份范各庄矿顺利完成井下排水泵房的智能化改造,传统人工巡检模式被远程集中监控替代
2026-01-19 20:04:00
安克与飞书联合发布“安克AI录音豆” 录音可在飞书中被AI调用
2026年1月19日,安克创新与飞书联合发布了最新AI硬件——安克AI录音豆,飞书提供了该产品的软件AI适配与服务。这款产品以极轻的"磁吸纽扣”形态实现无感随身佩戴
2026-01-19 17:13:00