• 我的订阅
  • 科技

语音能力再突破!讯飞星火语音大模型即将发布

类别:科技 发布时间:2024-01-29 15:57:00 来源:齐鲁晚报齐鲁壹点

记者 刘阿龙

人工智能快速发展催生语音合成技术不断成熟,让机器不仅能“开口说话”,还能“谈心交心”,在语音技术的突破下,人机交互将迎来新的发展阶段。1月30日,讯飞星火认知大模型V3.5升级发布会即将举行,会上将同步发布讯飞星火语音大模型, 此外还将发布开源大模型等。

2023年5月6日,科大讯飞正式发布了讯飞星火认知大模型,可以基于自然对话方式完成用户需求理解与任务执行。它还能支持“语音输入”及“语音播报”功能,可以实现对文本内容的朗读和纯享语音对话,这两项功能丰富了大模型的交互方式,拓宽了其场景应用的边界。

自首发以来,星火认知大模型经历V1.5版本的迭代,于去年8月15日如期迎来V2.0版本,对代码能力进行了代码生成、代码补齐、代码纠错、代码解释、单元测试生成5个维度升级,其多模态能力的升级具体体现在图像描述、图像问答、识图创作等多个维度。

语音能力再突破!讯飞星火语音大模型即将发布

去年10月24日,在第六届世界声博会暨2023科大讯飞全球1024开发者节的主论坛上,星火认知大模型V3.0正式发布,从文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力方面都有了持续的提升。星火V3.0进一步升级了多模态指令跟随与细节表达等能力,实现从多轮对话、主动对话再到启发式对话的跨越。

作为首个基于全国产化算力平台训练的全民开放大模型,讯飞星火认知大模型V3.5将打造更实用、更通用的大模型底座。据了解,1月30日,讯飞星火认知大模型V3.5发布会上将公布在语音能力方面实现的重要突破。

科大讯飞从语音起家,多年来在语音识别、语音合成、声音事件检测等多个领域始终保持源头核心技术创新迭代,并收获多项相关国际权威赛事和评测冠军。语音识别方面,科大讯飞继2016年参与以来,连续四届在国际多通道语音分离与识别大赛CHiME夺冠,领跑国际竞争对手;语音合成方面,科大讯飞获国际语音合成大赛Blizzard Challenge十四连冠,屡次在自然度、相似度等指标上打破纪录;在声音事件检测上,科大讯飞获2020、2022和2023年国际声学场景和事件检测及分类挑战赛DCASE多项冠军,展现了在智能音频技术领域的不俗实力。

持续技术创新的同时,科大讯飞也将智能语音技术赋能教育、医疗、金融、汽车、工业等多个行业领域,科大讯飞在不断推动智能语音技术革新的同时,也积极拓展其应用范围,与各行各业深度融合,为用户带来更加丰富和便捷的交互体验。不久前,科大讯飞在国际车载多通道语音识别挑战赛中取得ASR和ASDR两个赛道的第一名,相关技术已经在车载领域落地应用,有效提升了车内语音识别准确率,让车上多个位置的乘客与语音助手交互实现互不干扰,充分展现了新技术赋能行业新变革的重要价值。

从2021年语音云平台问世和讯飞输入法上线语音输入,到讯飞翻译机、AI学习机、录音笔、办公本等产品的不断推动,科大讯飞智能语音技术也已深入赋能到C端产品,服务更多用户,为工作、学习、生活提高效率,提供便利。

结合大模型底座,此次即将发布的语音大模型也将带来语音方面的多项技术创新升级和应用体验。智能语音是万物互联机器沟通的入口,语音大模型的发布也将推动全新人机交互变革,带来更便捷的语音交互和更广的语言互通。

投身于通用人工智能技术浪潮,科大讯飞始终以自主创新推动每一次技术跃迁。本次发布的星火语音大模型将以全球领先的主流语种能力,引领万物互联时代的人机交互革命。期待在大模型技术革新浪潮下,语音能力会实现更高的突破,未来将与多领域进行深度融合,持续赋能更多产品落地,实现多语种和个性化的全面提升。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-01-29 17:45:14

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

星火语音大模型由多语种语音合成
1月30日消息,星火语音大模型首次发布。据了解,星火语音大模型由多语种语音合成,在首批37个主流语种上已整体超越OpenAI公司推出的Whisper-large-v3
2024-01-31 02:18:00
端到端同传国内首个!科大讯飞星火同传语音大模型发布:领先Gemini 2.0、GPT-4o
快科技1月15日消息,今日,科大讯飞星火同传语音大模型正式发布,这是国内首个具备端到端语音同传能力的大模型。相较于讯飞此前的翻译技术,该模型在全场景下的翻译效果提大幅提升,端到端
2025-01-15 10:54:00
科大讯飞星火语音大模型正式发布
...升,数学、语言理解、语音交互能力超GPT-4Turbo;星火语音大模型正式发布,首批37个主流语种效果超过OpenAIWhisperV3
2024-02-01 10:07:00
讯飞星火V4.0整体超越GPT-4 Turbo,8个国际权威测试集测评第一
...,获得国家科学技术进步奖一等奖。发布会现场,星火语音大模型迎来新突破。面向万物互联时代,本次星火语音大模型发布国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37
2024-06-28 08:49:00
全国产算力平台“飞星一号”的首个成果发布:讯飞星火V3.5来了
...等“打工神器”获得台下一阵掌声点赞。正式发布星火语音大模型“大模型带来了语音技术发展的全新机会。”刘庆峰强调,让机器具备学习、推理和决策的能力,就是认知大模型要干的主要工作。
2024-01-30 22:41:00
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...布新升级的讯飞认知大模型星火V3.5,并发布了自研的语音大模型,以及星火开源大模型——星火开源-13B。过去一年,科大讯飞的重点都在大模型方向上,临近岁末放出大量更新,某种程
2024-01-31 07:32:00
国家科学技术进步一等奖,为何给了这家AI国家队
...1月30日,科大讯飞就基于上述技术融合路线发布了星火语音大模型,显著超过了OpenAI的Whisper v3的语音大模型能力
2024-06-25 09:30:00
科大讯飞构建全新语音建模框架 降低AI声音复刻门槛
...自然、语气连贯。此次讯飞技术突破的关键,除了星火语音大模型底座的基础和持续迭代,还构建了一套三阶段层次化语音建模框架。首先,通过星火底座大模型精确捕捉发音规律和韵律特征。其次
2025-06-27 17:52:00
科大讯飞多语种技术,提供超1亿分钟公益服务
...语种冠军及7个语种非受限赛道冠军;2024年,讯飞星火语音大模型的首批37个主流语种的语音识别效果超过OpenAI最新语音大模型Whisper V3
2024-05-08 15:08:00
更多关于科技的资讯:
据IDC与《2025中国生成式AI搜索生态白皮书》联合数据显示,截至2025年第三季度,中国GEO服务市场规模已达220亿元
2025-10-25 21:09:00
周一围与博斯绅威共赴“轻装之约”,解锁网球生活新方式
金秋济南,共赴网球生活时光。10月25日下午,博斯绅威携品牌体验官、著名演员周一围先生,在济南银座商城举办了一场主题为“轻装上阵
2025-10-26 12:28:00
曹县汉服“遇上”拼多多:95后的创业翻盘记
鲁网10月24日讯曹县,素有“中国汉服产业重镇”之称,曾见证无数小微创业者在行业竞争中艰难求索。对许多创业者而言,汉服市场度过初期蓝海阶段后
2025-10-24 14:29:00
突破光谱检测瓶颈!中国计量大学本科生团队研制高分辨率光谱仪
通讯员:吴瑞鹏 何秋阳近日,第十九届“挑战杯”全国大学生课外学术科技作品竞赛正火热备赛中,全国高校参赛队伍蓄势待发。中国计量大学光学与电子科技学院本科生团队项目——“基于微反射镜阵列的高分辨率光谱仪”
2025-10-24 15:02:00
开普勒机器人登陆IROS 2025 以开放平台携手全球开发者共筑新生态
10月19日至25日,全球机器人领域两大顶级国际会议之一的2025年IEEE/RSJ智能机器人与系统国际会议(IROS 2025)在杭州隆重举行
2025-10-24 15:02:00
蓝月亮:用十二年为洁净艺术种下一棵“树”
10月23日,第十七届国际大学生暨青年艺术博览会(简称:大艺博)开幕。在武汉东部的中国光谷科技会展中心10000平方米的专业展馆内
2025-10-24 15:14:00
京东工业与南方电网供应链集团签署战略合作 以数智技术驱动供应链全面升级
10月20日,京东工业与南方电网供应链集团在广州正式签署战略合作协议,双方相关负责人出席签约仪式。此次合作标志着京东集团与南方电网在供应链领域的协作迈入全新阶段
2025-10-24 15:23:00
从OS到AI OS:荣耀MagicOS 10定义AI OS新时代
2025年10月23日,荣耀全球开发者大会暨AI终端生态大会在深圳坪山燕子湖国际会展中心隆重举行。本次大会系统阐释了MagicOS 10的品牌战略与发展路径
2025-10-24 15:32:00
最后窗口期!2025FHC上海环球食品展免费领票即将截止
2025FHC上海环球食品展已进入开幕倒计时!这场被誉为“全球食饮贸易超级接口”的盛会,已成为零售买家囤货、拓品的关键“战场”—20万㎡展出面积
2025-10-24 15:47:00
K90定价后引热议闪电降价,雷军:标准版12GB+512GB 版本首销月直降300元
2025年10月23日的红米K90发布会后,12GB+512GB版本原定价为3199元,但因用户反馈该版本与其他配置差价过大
2025-10-24 15:57:00
iPhone 17系列首批用户反应褪色? 苹果官方客服回应
近日,部分苹果 iPhone 17 Pro 及 iPhone 17 Pro Max 的首批用户在社交平台反映,其设备遭遇了机身褪色问题
2025-10-24 15:59:00
阿里夸克AI眼镜开启预售 体验者:轻若无物,稳如长在脸上“看一眼”就能支付
阿里巴巴首款自研AI眼镜——夸克AI眼镜24日0时在夸克智能设备天猫旗舰店开启预售。88VIP会员实际到手价为3699元
2025-10-24 16:35:00
河北新闻网讯(梁轩轩)“原以为开业办税很繁琐,没想到这么简单!”近日,石家庄市桥西区律吕五金产品商行法人柴浩在桥西区税务局办税大厅完成税务申报后
2025-10-24 16:59:00
近日,瑞众人寿河北分公司在保定举办了2025年嘉年华客服节系列活动之“养老规划线下体验日”活动,通过创新融合中医药文化
2025-10-24 17:06:00
“尖货”频出!临安这里科技含量UpUpUp
是一场什么样的比赛技术“尖货”频出“硬核”创新不断近日,2025“海康创行・瓴创青山”智能物联青山湖科技城高层次人才创业大赛第二期
2025-10-24 17:07:00