一种基于说话人对抗子网络的语音转换方法

    公开(公告)号:CN116778937B

    公开(公告)日:2024-01-23

    申请号:CN202310314078.X

    申请日:2023-03-28

    Abstract: 本发明公开了一种基于说话人对抗子网络的语音转换方法。本发明通过在将说话人对抗子网络嵌入至语音转换模型StarGAN‑VC2中,提出了添加说话人对抗子网络辅助特征解码的策略,并融合了说话人对抗损失函数与生成器损失函数,使得二者在对抗中提高编码器的说话人身份信息去除效果,同时为了更好地适应语音转换任务,引入了自适应实例归一化算法辅助特征解码,能够有效的提升语音转换的质量以及说话人相似度,因此,使得语音在转换过程中,具有检验与反馈机制,非语义特征剔除彻底,可以在保持多对多的非平行语料转换方法优越性的前提下,创造出一个说话人身份信息去除辅助与验证机(56)对比文件Yutian Wang et al.FeatureQuantization for Many-to-many VoiceConversion. 2020 IEEE InternationalConference on Information Technology,BigData and Artificial Intelligence (ICIBA).2020,全文.

    一种基于说话人对抗子网络的语音转换方法

    公开(公告)号:CN116778937A

    公开(公告)日:2023-09-19

    申请号:CN202310314078.X

    申请日:2023-03-28

    Abstract: 本发明公开了一种基于说话人对抗子网络的语音转换方法。本发明通过在将说话人对抗子网络嵌入至语音转换模型StarGAN‑VC2中,提出了添加说话人对抗子网络辅助特征解码的策略,并融合了说话人对抗损失函数与生成器损失函数,使得二者在对抗中提高编码器的说话人身份信息去除效果,同时为了更好地适应语音转换任务,引入了自适应实例归一化算法辅助特征解码,能够有效的提升语音转换的质量以及说话人相似度,因此,使得语音在转换过程中,具有检验与反馈机制,非语义特征剔除彻底,可以在保持多对多的非平行语料转换方法优越性的前提下,创造出一个说话人身份信息去除辅助与验证机制,语音转换效果好,具有良好的应用前景。

    一种基于爬楼与行驶的一体化装置

    公开(公告)号:CN216232654U

    公开(公告)日:2022-04-08

    申请号:CN202123003679.4

    申请日:2021-12-02

    Abstract: 本实用新型公开了一种基于爬楼与行驶的一体化装置,涉及爬楼运输装置技术领域,该一体化装置包括:动力轮、转向机构、蜗轮蜗杆减速机、爬楼机构、升降机构、机架、电池、三角轮和单片机,所述动力轮设置于机架的前端,所述转向机构、蜗轮蜗杆减速机、升降机构、电池、三角轮均固定于机架上,所述转向机构与动力轮连接,所述蜗轮蜗杆减速机与爬楼机构连接,所述转向机构、蜗轮蜗杆减速机、升降机构、电池均与单片机连接。本实用新型的一体化装置能够帮助老人、残疾人正常上下楼及路面行驶,具有灵活性强、不易打滑、适用范围广的特点。

Patent Agency Ranking