• 我的订阅
  • 科技

语音能力再突破!讯飞星火语音大模型即将发布

类别:科技 发布时间:2024-01-29 15:57:00 来源:齐鲁晚报齐鲁壹点

记者 刘阿龙

人工智能快速发展催生语音合成技术不断成熟,让机器不仅能“开口说话”,还能“谈心交心”,在语音技术的突破下,人机交互将迎来新的发展阶段。1月30日,讯飞星火认知大模型V3.5升级发布会即将举行,会上将同步发布讯飞星火语音大模型, 此外还将发布开源大模型等。

2023年5月6日,科大讯飞正式发布了讯飞星火认知大模型,可以基于自然对话方式完成用户需求理解与任务执行。它还能支持“语音输入”及“语音播报”功能,可以实现对文本内容的朗读和纯享语音对话,这两项功能丰富了大模型的交互方式,拓宽了其场景应用的边界。

自首发以来,星火认知大模型经历V1.5版本的迭代,于去年8月15日如期迎来V2.0版本,对代码能力进行了代码生成、代码补齐、代码纠错、代码解释、单元测试生成5个维度升级,其多模态能力的升级具体体现在图像描述、图像问答、识图创作等多个维度。

语音能力再突破!讯飞星火语音大模型即将发布

去年10月24日,在第六届世界声博会暨2023科大讯飞全球1024开发者节的主论坛上,星火认知大模型V3.0正式发布,从文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力方面都有了持续的提升。星火V3.0进一步升级了多模态指令跟随与细节表达等能力,实现从多轮对话、主动对话再到启发式对话的跨越。

作为首个基于全国产化算力平台训练的全民开放大模型,讯飞星火认知大模型V3.5将打造更实用、更通用的大模型底座。据了解,1月30日,讯飞星火认知大模型V3.5发布会上将公布在语音能力方面实现的重要突破。

科大讯飞从语音起家,多年来在语音识别、语音合成、声音事件检测等多个领域始终保持源头核心技术创新迭代,并收获多项相关国际权威赛事和评测冠军。语音识别方面,科大讯飞继2016年参与以来,连续四届在国际多通道语音分离与识别大赛CHiME夺冠,领跑国际竞争对手;语音合成方面,科大讯飞获国际语音合成大赛Blizzard Challenge十四连冠,屡次在自然度、相似度等指标上打破纪录;在声音事件检测上,科大讯飞获2020、2022和2023年国际声学场景和事件检测及分类挑战赛DCASE多项冠军,展现了在智能音频技术领域的不俗实力。

持续技术创新的同时,科大讯飞也将智能语音技术赋能教育、医疗、金融、汽车、工业等多个行业领域,科大讯飞在不断推动智能语音技术革新的同时,也积极拓展其应用范围,与各行各业深度融合,为用户带来更加丰富和便捷的交互体验。不久前,科大讯飞在国际车载多通道语音识别挑战赛中取得ASR和ASDR两个赛道的第一名,相关技术已经在车载领域落地应用,有效提升了车内语音识别准确率,让车上多个位置的乘客与语音助手交互实现互不干扰,充分展现了新技术赋能行业新变革的重要价值。

从2021年语音云平台问世和讯飞输入法上线语音输入,到讯飞翻译机、AI学习机、录音笔、办公本等产品的不断推动,科大讯飞智能语音技术也已深入赋能到C端产品,服务更多用户,为工作、学习、生活提高效率,提供便利。

结合大模型底座,此次即将发布的语音大模型也将带来语音方面的多项技术创新升级和应用体验。智能语音是万物互联机器沟通的入口,语音大模型的发布也将推动全新人机交互变革,带来更便捷的语音交互和更广的语言互通。

投身于通用人工智能技术浪潮,科大讯飞始终以自主创新推动每一次技术跃迁。本次发布的星火语音大模型将以全球领先的主流语种能力,引领万物互联时代的人机交互革命。期待在大模型技术革新浪潮下,语音能力会实现更高的突破,未来将与多领域进行深度融合,持续赋能更多产品落地,实现多语种和个性化的全面提升。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-01-29 17:45:14

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

星火语音大模型由多语种语音合成
1月30日消息,星火语音大模型首次发布。据了解,星火语音大模型由多语种语音合成,在首批37个主流语种上已整体超越OpenAI公司推出的Whisper-large-v3
2024-01-31 02:18:00
端到端同传国内首个!科大讯飞星火同传语音大模型发布:领先Gemini 2.0、GPT-4o
快科技1月15日消息,今日,科大讯飞星火同传语音大模型正式发布,这是国内首个具备端到端语音同传能力的大模型。相较于讯飞此前的翻译技术,该模型在全场景下的翻译效果提大幅提升,端到端
2025-01-15 10:54:00
科大讯飞星火语音大模型正式发布
...升,数学、语言理解、语音交互能力超GPT-4Turbo;星火语音大模型正式发布,首批37个主流语种效果超过OpenAIWhisperV3
2024-02-01 10:07:00
讯飞星火V4.0整体超越GPT-4 Turbo,8个国际权威测试集测评第一
...,获得国家科学技术进步奖一等奖。发布会现场,星火语音大模型迎来新突破。面向万物互联时代,本次星火语音大模型发布国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37
2024-06-28 08:49:00
全国产算力平台“飞星一号”的首个成果发布:讯飞星火V3.5来了
...等“打工神器”获得台下一阵掌声点赞。正式发布星火语音大模型“大模型带来了语音技术发展的全新机会。”刘庆峰强调,让机器具备学习、推理和决策的能力,就是认知大模型要干的主要工作。
2024-01-30 22:41:00
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...布新升级的讯飞认知大模型星火V3.5,并发布了自研的语音大模型,以及星火开源大模型——星火开源-13B。过去一年,科大讯飞的重点都在大模型方向上,临近岁末放出大量更新,某种程
2024-01-31 07:32:00
国家科学技术进步一等奖,为何给了这家AI国家队
...1月30日,科大讯飞就基于上述技术融合路线发布了星火语音大模型,显著超过了OpenAI的Whisper v3的语音大模型能力
2024-06-25 09:30:00
科大讯飞多语种技术,提供超1亿分钟公益服务
...语种冠军及7个语种非受限赛道冠军;2024年,讯飞星火语音大模型的首批37个主流语种的语音识别效果超过OpenAI最新语音大模型Whisper V3
2024-05-08 15:08:00
讯飞星火首发智能体平台,敏捷触达大模型应用企业落地最后一公里
...取的痛点,科大讯飞发布业界首个长文本、长图文、长语音大模型,不仅能够把各种信息来源的海量文本、图文资料、会议录音等进行快速学习,还能够在各种行业场景给出专业、准确回答。科大讯
2024-04-26 11:44:00
更多关于科技的资讯: