一种语音对抗样本生成方法、装置、终端设备及介质

    公开(公告)号:CN117037843B

    公开(公告)日:2025-04-15

    申请号:CN202311165130.6

    申请日:2023-09-11

    Applicant: 中南大学

    Abstract: 本申请适用于语音安全技术领域,提供了一种语音对抗样本生成方法、装置、终端设备及介质。该方法通过获取待扰动语音样本集;计算其他说话人与当前说话人之间的语音相似度,确定目标说话人;对待扰动语音样本集进行语音端点检测,得到候选扰动语音帧;计算优先度和优先频数,确定优先重合帧;根据优先重合帧,确定待扰动语音样本集中的扰动点和扰动值,对待扰动语音样本集进行扰动,得到扰动结果;计算扰动结果与目标说话人对应的语音样本集之间的损失值;利用投影梯度下降算法对扰动点和扰动值进行更新,将损失值小于预设损失阈值的扰动结果作为当前说话人对应的语音对抗样本。本申请能够提高身份去识别效果和语音合成质量。

    一种语音对抗样本生成方法、装置、终端设备及介质

    公开(公告)号:CN117037843A

    公开(公告)日:2023-11-10

    申请号:CN202311165130.6

    申请日:2023-09-11

    Applicant: 中南大学

    Abstract: 本申请适用于语音安全技术领域,提供了一种语音对抗样本生成方法、装置、终端设备及介质。该方法通过获取待扰动语音样本集;计算其他说话人与当前说话人之间的语音相似度,确定目标说话人;对待扰动语音样本集进行语音端点检测,得到候选扰动语音帧;计算优先度和优先频数,确定优先重合帧;根据优先重合帧,确定待扰动语音样本集中的扰动点和扰动值,对待扰动语音样本集进行扰动,得到扰动结果;计算扰动结果与目标说话人对应的语音样本集之间的损失值;利用投影梯度下降算法对扰动点和扰动值进行更新,将损失值小于预设损失阈值的扰动结果作为当前说话人对应的语音对抗样本。本申请能够提高身份去识别效果和语音合成质量。

Patent Agency Ranking