• 我的订阅
  • 科技

第九届信也科技杯决赛举行,探索语音大模型鉴伪应用

类别:科技 发布时间:2024-07-26 11:44:00 来源:半点财说

7月23日,第九届信也科技杯全球人工智能算法大赛总决赛在上海举行。本届比赛主题为语音深度鉴伪识别,九支进入决赛的队伍通过现场答辩展示了多元化的算法解决方案,拓展了深度鉴伪识别的应用思路。

第九届信也科技杯决赛举行,探索语音大模型鉴伪应用

决赛邀请到来自浙江大学、上海交通大学、中国人民大学等顶尖院校的教授专家作为评审。信也科技总裁陈平平、首席运营官&首席技术官王玉翔现场致辞,信也科技副总裁、大数据及AI负责人陈磊,首席科学家王春平、算法科学家吕强亦作为评委出席此次赛事。

第九届信也科技杯决赛举行,探索语音大模型鉴伪应用

在大模型时代,人工智能合成语音与真实语音之间的界限变得越发模糊,提升与之匹配的识别技术迫在眉睫。第九届信也科技杯鼓励参赛者运用深度学习和人工智能对抗技术,开发出能够准确识别数据集中虚假语音的模型。在决赛中,选手运用不同的算法模型和训练思路进行识别,其中包括运用基于大模型的识别技术、基于传统端到端的识别技术等。

加入最新大模型生成的假语音,识别难度提升

获得冠军的团队,在初赛对假语音的正确识别率达99%以上,而其在复赛中的假语音正确识别率则接近80%。信也科技算法科学家吕强介绍,初赛中的语音数据集主要由传统端到端TTS(文字转语音)生成的假语音组成,识别难度较低;而复赛数据集中首次加入了基于最新大模型生成的假语音、翻录假语音以及由真假语言拼接而成的样本,覆盖英语、法语、西班牙语等五种以上的语言,比赛难度随之增加。

“复赛加入由大模型生成的假语音后比赛难度变大,也能说明最新大模型‘以假乱真’的能力变强了,这要求相应的深度伪造识别技术必须要跟上脚步,才能保护大众不被深度伪造滥用行为伤害。”吕强说。

用“模法”识别“模法”

此次比赛涌现出多样化的创新算法解决方案,对实际业务落地具有参考意义。选手们有针对性地使用了多种语音数据增强算法对数据进行了扩充,并大胆地尝试了多种算法模型。让评委组印象深刻的是,不少选手使用了最新大模型的识别技术,并且考虑了模型的实用性,尝试提高推理效率、减少模型推理耗时。

信也科技副总裁、大数据及AI负责人陈磊表示:“选手们探索了多种语音鉴伪方案,为对抗假语音欺诈的应用提供了不少思路。例如,有些选手用大模型识别由大模型生成的假语音——用‘模法’识别‘模法’,取得了不错的识别效果,未来在金融科技场景经过进一步打磨后有可期的应用价值。语音大模型的研究需要把应用问题抽象提炼成学术问题,在解决学术问题后经过工程化,解决具体业务场景的真实需求。”

优胜队伍将赴全球AI顶会展示成果

经过评委组现场打分和讨论,结合复赛成绩,最终揭晓获奖名单。本届“信也科技杯”是全球人工智能A类顶会——2024国际人工智能联合会议(IJCAI)的赛事单元之一。优胜队伍将在8月前往韩国济州岛,在IJCAI2024大会现场展示研究成果,并与全球算法专家共同交流。

第九届信也科技杯决赛举行,探索语音大模型鉴伪应用

(信也科技总裁陈平平)

信也科技总裁陈平平在活动中表示:“信也科技杯的诞生初心根植于培养技术人才、激发创新精神。这项赛事历经九年,为不断涌现的算法优秀人才提供了思维碰撞与交流的平台。科技和创新写在了信也科技的基因里,我们将坚持科技初心、深耕科技赋能,为行业高质量发展贡献力量。”

第九届信也科技杯决赛举行,探索语音大模型鉴伪应用

(信也科技首席运营官、首席技术官王玉翔)

信也科技首席运营官&首席技术官王玉翔对活动进行总结致辞:“随着深度伪造生成技术不断升级,相信鉴伪技术的发展也会齐头并进,最终达到矛与盾互相制衡的局面。我们期待信也科技杯未来将不断探索前沿科技,赋能人才、学界、业务、产业,推动新质生产力蓬勃发展。”

自今年5月启动以来,第九届信也科技杯吸引了461支队伍、709名来自海内外顶尖高校以及知名企业的选手报名参赛。

举办九年至今,“信也科技杯”已吸引近万名海内外顶尖高校人才和知名企业的科研人员参与。历届赛事主题均贴合行业前沿和技术热点,曾聚焦“语音方言距离识别”、“智能零售柜商品识别”、“助力小微企业信贷服务”等主题。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-26 14:45:11

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

语音能力再突破!讯飞星火语音大模型即将发布
...型V3.5升级发布会即将举行,会上将同步发布讯飞星火语音大模型, 此外还将发布开源大模型等。2023年5月6日,科大讯飞正式发布了讯飞星火认知大模型,可以基于自然对话方式完成
2024-01-29 15:57:00
...信CTO、人工智能研究院院长李学龙带领下,推出了星辰语音大模型,通过超大规模语音预训练和多方言联合建模,率先实现单一模型支持30种方言自由混说语音识别,是国内支持最多方言、覆
2024-05-27 14:51:00
科大讯飞星火语音大模型正式发布
...升,数学、语言理解、语音交互能力超GPT-4Turbo;星火语音大模型正式发布,首批37个主流语种效果超过OpenAIWhisperV3
2024-02-01 10:07:00
国内首个端到端语音大模型开启内测预约
...息,金科汤姆猫投资的西湖心辰于今年8月推出心辰Lingo语音大模型,是国内首个端到端语音大模型,已于今天(8月24日)开启内测预约。在8月21日发布的公告中,官方介绍称相比较
2024-08-25 02:57:00
国家科学技术进步一等奖,为何给了这家AI国家队
...1月30日,科大讯飞就基于上述技术融合路线发布了星火语音大模型,显著超过了OpenAI的Whisper v3的语音大模型能力
2024-06-25 09:30:00
...入全新生命力。中国运营商发布首个支持30种方言混说语音大模型。25日,在第七届数字中国建设峰会上,中国电信人工智能研究院发布业内首个支持30种方言自由混说的语音识别大模型——
2024-05-25 20:19:00
国内首个端到端语音大模型将上线,人工智能也要有“情商”
...迭代更新。西湖心辰在今年8月推出了国内首个端到端语音大模型“心辰Lingo”,该模型具备实时打断、实时控制能力,以超拟人的互动方式,让对话更加生动、直观。所谓端到端语音大模型
2024-09-05 10:07:00
科大讯飞多语种技术,提供超1亿分钟公益服务
...语种冠军及7个语种非受限赛道冠军;2024年,讯飞星火语音大模型的首批37个主流语种的语音识别效果超过OpenAI最新语音大模型Whisper V3
2024-05-08 15:08:00
重磅!“国奖”放榜:十年来AI 领域首个国奖一等奖花落科大讯飞
...以将语音信号经过编码后输入到大语言模型,显著提升语音大模型的效果。大模型技术可以在复杂语义理解、长文本建模能力上进一步提升语音识别、合成和翻译的效果,同时基于其强大的语义理解
2024-06-26 09:15:00
更多关于科技的资讯: