基于通道注意力深度可分卷积网络的小样本话者辨认方法

    公开(公告)号:CN113823292B

    公开(公告)日:2023-07-21

    申请号:CN202110954659.0

    申请日:2021-08-19

    Abstract: 本发明公开了一种基于通道注意力深度可分卷积网络的小样本话者辨认方法,步骤如下:从训练语音提取对数梅尔谱特征,训练得到通道注意力深度可分卷积网络;将注册(小样本)语音的对数梅尔谱特征输入已训练网络,得到它们的深度特征,计算所有注册语音的深度特征均值矢量并作为对应话者的中心矢量;将测试语音的对数梅尔谱特征输入已训练网络,得到它们的深度特征,计算测试语音深度特征与注册语音各话者中心矢量之间的距离,距离最小的中心矢量所对应的话者即为测试语音所属话者。本发明方法既减小了网络规模又降低了网络训练难度,有效缓解小样本话者辨认的过拟合问题,获得更满意话者辨认结果。

    基于自蒸馏预训练和元学习微调的远场说话人确认方法

    公开(公告)号:CN116863937A

    公开(公告)日:2023-10-10

    申请号:CN202310689924.6

    申请日:2023-06-12

    Abstract: 本发明公开了一种基于自蒸馏预训练和元学习微调的远场说话人确认方法,过程如下:从近场训练语音提取对数梅尔谱特征作为网络的输入,采用自蒸馏学习方法预训练深度神经网络;接着,将远场训练语音的对数梅尔谱特征作为网络的输入,采用元学习方法微调经过预训练的网络;然后,将注册语音的对数梅尔谱特征输入经过预训练和微调的网络得到变换特征矢量,将测试语音的对数梅尔谱特征输入经过微调和预训练的网络得到变换特征矢量;最后,计算测试语音变换特征矢量与注册语音变换特征矢量之间的距离,判断二者是否来自同一个说话人。本发明方法既提高了网络训练效率,又提升了网络在注册语音与测试语音的录制环境不一致时的说话人确认准确率。

    基于通道注意力深度可分卷积网络的小样本话者辨认方法

    公开(公告)号:CN113823292A

    公开(公告)日:2021-12-21

    申请号:CN202110954659.0

    申请日:2021-08-19

    Abstract: 本发明公开了一种基于通道注意力深度可分卷积网络的小样本话者辨认方法,步骤如下:从训练语音提取对数梅尔谱特征,训练得到通道注意力深度可分卷积网络;将注册(小样本)语音的对数梅尔谱特征输入已训练网络,得到它们的深度特征,计算所有注册语音的深度特征均值矢量并作为对应话者的中心矢量;将测试语音的对数梅尔谱特征输入已训练网络,得到它们的深度特征,计算测试语音深度特征与注册语音各话者中心矢量之间的距离,距离最小的中心矢量所对应的话者即为测试语音所属话者。本发明方法既减小了网络规模又降低了网络训练难度,有效缓解小样本话者辨认的过拟合问题,获得更满意话者辨认结果。

Patent Agency Ranking