声音转换模型训练方法、声音转换方法及装置

    公开(公告)号:CN119763590A

    公开(公告)日:2025-04-04

    申请号:CN202510003289.0

    申请日:2025-01-02

    Abstract: 本发明提供一种声音转换模型训练方法、声音转换方法及装置,涉及数据处理技术领域,包括:获取多个不同发声人的发声人音频样本;其中,每个发声人音频样本对应一个基频标签;根据各个发声人音频样本对应的自动语音识别样本特征和发声人样本特征向量,对预设声音转换模型进行训练,得到第一声音转换模型;基于目标发声人的各个发声人音频伪造样本对应的伪造自动语音识别特征和发声人样本特征向量,对第一声音转换模型进行训练,得到第二声音转换模型;其中,发声人音频伪造样本是根据目标发声人真实的发声人音频样本得到的;第二声音转换模型用于基于发声人音频对应的自动语音识别特征和发声人特征向量,输出发声人音频对应的基频信息。

Patent Agency Ranking