基于CBAM和动态卷积分解的歌唱语音转换方法

    公开(公告)号:CN115881088A

    公开(公告)日:2023-03-31

    申请号:CN202211423682.8

    申请日:2022-11-15

    Inventor: 李燕萍 高崧皓

    Abstract: 本发明属于语音转换技术领域,具体地说,是一种基于CBAM和动态卷积分解的歌唱语音转换方法,包括训练阶段和转换阶段,模型网络包括生成器、鉴别器和风格编码器。首先在生成器中引入动态卷积分解,通过动态通道融合来代替通道组的动态关注,解决生成器中动态卷积会导致卷积权重的数量增加K倍的问题,减轻了联合优化的难度,并且使得模型在不牺牲精度的情况下,需要的参数更少,提高算法的运行性能。进一步在生成器的编码网络和解码网络引入CBAM注意力模块,在通道和空间施加注意力,提升对频谱中细节信息的关注与捕获,显著改善转换歌唱语音的质量。

Patent Agency Ranking