一种基于生成式对抗网络的音频风格统一的方法

    公开(公告)号:CN113096675B

    公开(公告)日:2024-04-23

    申请号:CN202110351514.1

    申请日:2021-03-31

    Applicant: 厦门大学

    Abstract: 本发明公开了一种基于生成式对抗网络的音频风格统一的方法,包括步骤1:获取初始数据集和噪声数据集;步骤2:将初始数据集和噪声数据集进行预处理,生成噪声混合音频和风格模板音频并确定与其相关的训练数据集和测试数据集;步骤3:搭建生成网络模型,训练生成器网络G用于音频风格统一,输入为噪声混合音频和风格模板音频,输出为目标风格的音频和目标风格的频谱;步骤4:搭建判别网络模型,训练判别器网络D用以衡量生成器输出的目标风格的频谱和风格模板频谱的相似程度;步骤5:构建损失函数模型并训练生成式对抗网络;本方案一种基于生成对抗网络的音频风格统一的方法,可以按照用户选定的音频风格去调整其他输入音频的风格。

    一种基于生成式对抗网络的音频风格统一的方法

    公开(公告)号:CN113096675A

    公开(公告)日:2021-07-09

    申请号:CN202110351514.1

    申请日:2021-03-31

    Applicant: 厦门大学

    Abstract: 本发明公开了一种基于生成式对抗网络的音频风格统一的方法,包括步骤1:获取初始数据集和噪声数据集;步骤2:将初始数据集和噪声数据集进行预处理,生成噪声混合音频和风格模板音频并确定与其相关的训练数据集和测试数据集;步骤3:搭建生成网络模型,训练生成器网络G用于音频风格统一,输入为噪声混合音频和风格模板音频,输出为目标风格的音频和目标风格的频谱;步骤4:搭建判别网络模型,训练判别器网络D用以衡量生成器输出的目标风格的频谱和风格模板频谱的相似程度;步骤5:构建损失函数模型并训练生成式对抗网络;本方案一种基于生成对抗网络的音频风格统一的方法,可以按照用户选定的音频风格去调整其他输入音频的风格。

Patent Agency Ranking