-
公开(公告)号:CN117079658A
公开(公告)日:2023-11-17
申请号:CN202311183589.9
申请日:2023-09-14
Applicant: 北京邮电大学
IPC: G10L21/003 , G10L25/48 , G10L25/27 , G10L19/008 , G10L19/16
Abstract: 一种基于差分隐私的说话人匿名化系统及方法,涉及语音处理领域,该方法包括:对于每条原始语音,分别提取出说话人向量、基频F0和内容特征;利用广义差分隐私算法对提取出的说话人向量进行批量匿名化处理,获得匿名说话人向量;将匿名说话人向量、基频F0和内容特征进行合成,生成脱敏后的匿名化语音波形数据。本发明通过将广义差分隐私与基于自监督模型的语言可迁移说话人匿名化框架相结合,可在攻击者已经具有一部分先验知识的情况下,依旧能保障说话人身份隐私数据的安全性,并且能在保证匿名后语音的隐私性的同时依旧保证匿名后的语音具有良好的可用性,更好地解决WER和EER之间的平衡性问题。
-
公开(公告)号:CN116403586A
公开(公告)日:2023-07-07
申请号:CN202310422093.6
申请日:2023-04-19
Applicant: 北京邮电大学
Abstract: 本发明公开了一种面向ASV系统的通用语音欺骗检测模型的建立方法,通过引入子网络方法,设计检测LA攻击的LANet,检测PA攻击的PANet以及联合检测LA攻击和PA攻击的混合模型FusionNet。该方法以LANet的浅层参数为基础,构建了一个轻量级的PANet,最后将LANet与PANet输出的embedding进行连接,送入FusionNet中,判定输入语音是否为真实语音。本发明在现有的针对特定攻击的检测模型的基础上,增加少量参数就可构建一个通用的语音欺骗检测模型,该模型既可以检测LA攻击又可以检测PA攻击,解决了现有模型仅能检测特定攻击的问题,同时实现轻量化,从而满足实际应用的需求。
-
公开(公告)号:CN117198299A
公开(公告)日:2023-12-08
申请号:CN202311164243.4
申请日:2023-09-11
Applicant: 北京邮电大学
Abstract: 本发明涉及声纹识别技术领域,特别涉及一种基于时域频域编码特征的语音欺骗检测方法,目前还没有一个比较完备的方法能够有效对于声纹的主要特征进行融合分析的技术问题,与其他技术方案不同之处在于,具体技术方案是通过对原始语音信号进行幅度谱处理、设置阈值,突破传统的二进制编码特性,使用三值编码进行语音信号的特征分析以获得语音信号的特征输出数据,有效获取语音信号的时域变换属性,不涉及对音频本身的频域处理,使得语音特征更简洁清晰,通过高维度特征向量输出,可以更好地捕捉真实语音和合成语音之间变化的这些动态属性。
-
-