• 我的订阅
  • 科技

浙大推出新型语音信息掩蔽技术 量“声”定制反窃听系统

类别:科技 发布时间:2023-01-14 10:46:00 来源:每日看点快看

本文转自:浙江日报

浙江新闻客户端见习记者 涂佳煜 通讯员 柯溢能

我们的一段声音,究竟包含着多少有关个人的信息?

交谈的内容,可能透露出说话者生活细节、个人隐私;声音本身作为人最基本的自然生物特征,能够标记身份,用于声纹识别;说话的音色、语调、停顿,以及更多细微的声音特征,还可能揭示出一个人的性格、心情、习惯等等,尤其在人工智能的介入下,用声音创建一份“个性档案”,已不再是天方夜谭。

然而,互联网时代,无处不在的智能设备时常如同“隔墙有耳”,未经允许收集用户语音信息的案例也层出不穷。如何保护好我们的声音信息安全?一款有效的防窃听设备,或能筑起第一道防线。

近期,浙江大学网络安全学院任奎教授团队设计了一款基于人类语音结构和超声波隐蔽传输的语音防窃听系统“InfoMasker”,相关论文被国际顶级信息安全会议NDSS录用。研究团队成员,论文第一作者、浙大网安学院博士生黄鹏,“百人计划”研究员巴钟杰和求是科创学者薛峰共同向我们介绍了这项成果。

“InfoMasker防窃听的方式很容易理解。”黄鹏告诉记者,“就是往麦克风里注入一种干扰噪声,使得设备即便录了音,也无法从中获取任何关于用户的信息。”

浙大推出新型语音信息掩蔽技术 量“声”定制反窃听系统

InfoMasker的工作场景

注入干扰噪声是反窃听常用的手段。不过,团队在设计InfoMasker时希望达成两个现有设备无法“两全”的目标:第一,是在防窃听的同时确保用户的“无感”,第二,则是让注入的噪音无法被后期“剥离”。

巴钟杰解释,主流的干扰手段大多是发射一些高能量噪声将原声盖过去,这种“简单粗暴”的方式存在不少弊端:如果发射的是白噪音,就好比播放了一段嘈杂的背景音乐,必然打扰到用户正常交谈;如果发射的是高能量超声波,不仅对设备能量支持提出了很高的要求,还可能对人体健康产生不利影响。

“此外我们测试了市面上很多款产品,发现人工智能算法都能把注入的噪音剥离,这样一来,干扰就是无效的。”黄鹏说。

为了解决这些问题,一方面,团队仍选择以超声波作为载体,把噪声调制到人耳听不见,但能够被麦克风自动解调出来的超声波频率范围上。另一方面,他们进一步设计了一款新型的基于音素的噪声干扰方案。

浙大推出新型语音信息掩蔽技术 量“声”定制反窃听系统

InfoMasker的工作流程

音素,是根据发音动作划分出的最小的语音单位,比如,普通话的音素一般来说就是汉字的声母和韵母。在语音识别技术中,计算机需要将每帧声音组合为音素,再组合为字词。试想,如果能将音素打乱,计算机就无法将其组合、匹配为具有含义的单位,声音便失去了意义。

沿着这一思路,团队制作出了一种噪音,它能用其他音素覆盖录音中原有的音素,或者在两个音素间插入干扰项,打乱录音人声的语音结构,使窃听到的语音信号无法被正常分析。

更巧妙的是,干扰音素是依据用户的声音量“声”定制的。使用者只需要录制5秒左右的音频进行注册,系统就可以提取用户的音色,基于注册语音进行语料的匹配与增广,构建高效的音素噪声。

这种“精准投放”的干扰产生了一举两得的效果。“因为只需插入部分音素,而不需要全频段的噪声盖住所有声音,设备发出的超声波的能量就会低很多。” 黄鹏说,“此外,因为音素噪声和用户的音色非常接近,所以几乎无法被算法后期去除。”

实验结果标明,在办公室环境中,InfoMasker可以使得不同位置的智能设备录制的语音的识别准确率下降70%以上。在鲁棒性方面,音素噪声的抗剥离能力尤为优秀,现有的降噪算法和语音分离算法均无法有效去除此类噪声。

浙大推出新型语音信息掩蔽技术 量“声”定制反窃听系统

InfoMasker原型机

从团队向我们展示的照片中可以看到,InfoMasker的原型机由一个直径30厘米左右的球状超声发射阵列、一个功率放大器和一个信号发生器组成,其中信号发生器也可以用小型开发板替代。薛峰告诉记者,团队正积极将该原型机工程化落地,未来还将把它做得更为集成、精巧、便携。

在薛峰看来,我们面临的语音安全风险比一般人想象中要大得多。“市面上存在成千上万没有通过审核就上架的app,它们都可能诱骗用户授权麦克风权限,甚至一些小程序也可以录音,如果不法分子想获得用户的语音数据,拿去贩卖,或者用于深度伪造、电信诈骗,可以钻的漏洞其实非常多。”

不仅是手机,近年来,智能音箱、语音助手等智能设备遍地开花,但目前对这些设备的立法监管远不及手机应用那么完善,相关设备厂商对网络安全问题的重视程度也亟待加强。

“法律保障固然是重要的一环,但技术更需要走在前头。” 薛峰说,相比出台法律、实施监管所需要的长周期,快速迭代的技术更能在新兴的网络安全领域,对各种新型的入侵手段实现迅速的反制。

网络空间安全防护是一个系统性的工程。除了数据安全与隐私保护之外,浙大网安学院也正从软硬件系统安全、人工智能安全、网络与通信安全等方面开展技术攻关,既服务于国家重大战略需求,也为公众的隐私安全保驾护航。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-01-14 11:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...功将一名因脑干中风而严重瘫痪的女性的大脑信号转换成语音和动画表情,使这名女性患者能够通过“数字化身”与人交流。加州大学旧金山分校和伯克利分校等机构研究人员在这名瘫痪女性大脑表
2023-08-29 02:04:00
...名的真伪。1.2隐马尔可夫模型隐马尔可夫模型(HMM)是在语音识别中得到成功应用的一种随机过程方法。在线签名序列与语音序列有某些内在的相似性。在语音序列中,音素是一种基本元素
2024-03-24 17:33:00
能“听懂”用户情绪的对话机器人,已成为营销获客新的“技术红利”
...对性反馈。这样“神奇”的对话能力,来自背后的一系列语音技术。智能外呼有几项关键任务:听懂对方在说什么(ASR语音识别技术),做出正确的回应(NLP自然语言处理),用声音回复对
2024-01-25 17:06:00
脑机接口最新进展:让失语者用“思维”交流,准确率超七成
...能将大脑神经信号“翻译”转化成文本或单词,并由合成语音说出,速度各为每分钟60到80个单词。当前,人类自然对话的速度约为每分钟160个单词,而这两项新研究都已超越了此前脑机接
2023-08-29 17:19:00
脑机接口让失语者“开口说话”
本文转自:中国科学报脑机接口将大脑信号转换为语音和面部动作,并在动画人物身上表现出来。图片来源:Noah Berger本报讯 在实验室里
2023-08-29 07:33:00
...春上空,与此同步,部分城市居民和学校开展了紧急疏散掩蔽演练。这不仅仅是一次防空警报试鸣演练,更是为了警示人们铭记历史、勿忘国殇。“九一八”事变爆发92周年之际,为进一步提高“
2023-09-19 01:05:00
荣耀声纹新专利公布,可准确识别戴口罩所发语音
...音属于注册语音对应的用户。该专利申请将口罩对语音的掩蔽作用等效为作用在语音上的掩码,该掩码能够灵活准确地模拟口罩对不同频率声音的抑制作用,从而可以更准确地识别用户在戴口罩的情
2023-01-03 20:43:00
四川国动开展“全民国防教育月”活动
...国防动员宣传资源,开展防空警报试鸣、群众性紧急疏散掩蔽演练、国防知识挑战赛、主题征文等系列国防教育活动,采用线上媒体宣传与线下活动开展、传统媒体宣传与新媒体宣传相结合的形式,
2023-09-18 15:24:00
马斯克关注的“脑机接口”,让人类更懂自己的大脑
...。斯坦福大学的神经科学家 Frank Willett 正在研究一种用于语音的脑机接口,他说,“人类使用脑机接口,可以让我们有机会记录很多大脑区域的单个神经元活动,以前从未有人
2024-02-27 10:17:00
更多关于科技的资讯: