基于重构群延迟-常数Q变换语谱图的声纹欺诈检测方法

    公开(公告)号:CN114639387B

    公开(公告)日:2024-09-10

    申请号:CN202210221453.1

    申请日:2022-03-07

    Abstract: 本发明公开了一种声纹欺诈检测方法,将能量谱经由Q‑DCT和Q‑IDCT平滑处理的重构群延迟‑常数Q变换(以下称为RGD‑CQT)语谱图特征进行检测语音欺诈攻击的方法,解决了欺诈语音特征区分性不强及欺诈语音检测系统错误率高的问题。在训练时,先对语音序列进行填充或截取操作,进而将语音序列的每一位与索引序号加一的值进行相乘,获得新的语音序列。将两个语音序列分别进行常数Q变换(CQT,constant Q transform),获得两个语谱图X和Y。分别提取两张语谱图的实部和虚部,对语谱图X进行Q‑DCT和Q‑IDCT,之后进行修改的群延迟的计算,最后进行归一化和取对数得到最终的语谱图。将其作为resnet18+cbam网络的输入;然后通过交叉熵损失和Adam优化器训练出一个最优的网络模型作为用于测试的模型。最终根据网络模型的分数,如果分数大于0则认为是真实语音,反之,则判断为欺诈语音。

    基于重构群延迟-常数Q变换语谱图的声纹欺诈检测方法

    公开(公告)号:CN114639387A

    公开(公告)日:2022-06-17

    申请号:CN202210221453.1

    申请日:2022-03-07

    Abstract: 本发明公开了一种声纹欺诈检测方法,将能量谱经由Q‑DCT和Q‑IDCT平滑处理的重构群延迟‑常数Q变换(以下称为RGD‑CQT)语谱图特征进行检测语音欺诈攻击的方法,解决了欺诈语音特征区分性不强及欺诈语音检测系统错误率高的问题。在训练时,先对语音序列进行填充或截取操作,进而将语音序列的每一位与索引序号加一的值进行相乘,获得新的语音序列。将两个语音序列分别进行常数Q变换(CQT,constant Q transform),获得两个语谱图X和Y。分别提取两张语谱图的实部和虚部,对语谱图X进行Q‑DCT和Q‑IDCT,之后进行修改的群延迟的计算,最后进行归一化和取对数得到最终的语谱图。将其作为resnet18+cbam网络的输入;然后通过交叉熵损失和Adam优化器训练出一个最优的网络模型作为用于测试的模型。最终根据网络模型的分数,如果分数大于0则认为是真实语音,反之,则判断为欺诈语音。

Patent Agency Ranking