一种端到端多尺度风格迁移的歌声转换方法及系统

    公开(公告)号:CN118969013A

    公开(公告)日:2024-11-15

    申请号:CN202410944150.1

    申请日:2024-07-15

    Abstract: 本发明属于歌声转换领域,涉及一种端到端多尺度风格迁移的歌声转换方法及系统。该方法包括:采集待转换的目标歌声并进行预处理,去除伴奏音;将预处理后的目标歌声和拟采用风格的参考歌声输入预先建立和训练好的歌声转换模型,输出具有参考歌声风格的合成歌声,实现风格迁移;所述歌声转换模型用于从预处理后的目标歌声中提取内容向量和MIDI,从参考歌声中提取全局和局部的风格向量、音高和CQT谱,经端到端处理得到歌声波形。本发明对歌唱进行多尺度风格建模,解决了经典歌声转换中风格相似性差的问题,并且进一步提升了音质,提升了歌声的自然度。

Patent Agency Ranking