联合时域和频域的伪造语音检测方法、装置、设备及介质

    公开(公告)号:CN116092503B

    公开(公告)日:2023-06-20

    申请号:CN202310355092.4

    申请日:2023-04-06

    Applicant: 华侨大学

    Abstract: 本发明提供了联合时域和频域的伪造语音检测方法、装置、设备及介质,包括:获取多组样本自然语音和样本伪造语音,构建语音样本库,并对语音样本库中的每条语音样本进行预处理,生成具有特定维度的时域信号组和频域信号组;根据时域分支网络、频域分支网络和跨域融合网络组成构建伪造语音检测训练模型,将时域和频域信号组输入至伪造语音检测训练模型中进行联合训练,生成伪造语音检测模型;获取待检测语音样本,对语音样本进行预处理,生成与相对应的时域和频域信号;将时域和频域信号输入至伪造语音检测模型中,进行检测,生成判别结果。旨在解决现有决策融合方法忽略了各模型在训练过程中的交互,使得不同特征不能充分地有机结合的问题。

    联合时域和频域的伪造语音检测方法、装置、设备及介质

    公开(公告)号:CN116092503A

    公开(公告)日:2023-05-09

    申请号:CN202310355092.4

    申请日:2023-04-06

    Applicant: 华侨大学

    Abstract: 本发明提供了联合时域和频域的伪造语音检测方法、装置、设备及介质,包括:获取多组样本自然语音和样本伪造语音,构建语音样本库,并对语音样本库中的每条语音样本进行预处理,生成具有特定维度的时域信号组和频域信号组;根据时域分支网络、频域分支网络和跨域融合网络组成构建伪造语音检测训练模型,将时域和频域信号组输入至伪造语音检测训练模型中进行联合训练,生成伪造语音检测模型;获取待检测语音样本,对语音样本进行预处理,生成与相对应的时域和频域信号;将时域和频域信号输入至伪造语音检测模型中,进行检测,生成判别结果。旨在解决现有决策融合方法忽略了各模型在训练过程中的交互,使得不同特征不能充分地有机结合的问题。

    跨域信息自适应融合的语音合成方法、装置、设备及介质

    公开(公告)号:CN118447819A

    公开(公告)日:2024-08-06

    申请号:CN202410766121.0

    申请日:2024-06-14

    Applicant: 华侨大学

    Abstract: 本发明提供了跨域信息自适应融合的语音合成方法、装置、设备及介质,使用音素序列作为文本域信息,对数梅尔谱作为频域信息,建立样本文本及对应样本音频的数据库,从样本文本中获取音素序列和样本音频中提取对数梅尔谱;根据音素特征提取、频谱特征压缩、跨域特征对齐和频谱细节填充模块构建语音合成模型,将音素序列和对数梅尔谱输入语音合成模型中进行训练,得到训练后的语音合成模型;获取待合成文本数据,从待合成文本中获取音素序列,初始一个常量矩阵;将音素序列和常量矩阵输入训练后的语音合成模型中,得到待合成文本对应的合成对数梅尔谱。此外,现有自回归语音合成模型在训练中因长短期记忆网络而限制了并行能力,增加了训练时间成本。

Patent Agency Ranking