-
公开(公告)号:CN116778937B
公开(公告)日:2024-01-23
申请号:CN202310314078.X
申请日:2023-03-28
Applicant: 南京工程学院
IPC: G10L21/013 , G06N3/0464 , G06N3/0475 , G06N3/094 , G10L19/16 , G10L25/18 , G10L25/24 , G10L25/30
Abstract: 本发明公开了一种基于说话人对抗子网络的语音转换方法。本发明通过在将说话人对抗子网络嵌入至语音转换模型StarGAN‑VC2中,提出了添加说话人对抗子网络辅助特征解码的策略,并融合了说话人对抗损失函数与生成器损失函数,使得二者在对抗中提高编码器的说话人身份信息去除效果,同时为了更好地适应语音转换任务,引入了自适应实例归一化算法辅助特征解码,能够有效的提升语音转换的质量以及说话人相似度,因此,使得语音在转换过程中,具有检验与反馈机制,非语义特征剔除彻底,可以在保持多对多的非平行语料转换方法优越性的前提下,创造出一个说话人身份信息去除辅助与验证机(56)对比文件Yutian Wang et al.FeatureQuantization for Many-to-many VoiceConversion. 2020 IEEE InternationalConference on Information Technology,BigData and Artificial Intelligence (ICIBA).2020,全文.
-
公开(公告)号:CN116778937A
公开(公告)日:2023-09-19
申请号:CN202310314078.X
申请日:2023-03-28
Applicant: 南京工程学院
IPC: G10L21/013 , G06N3/0464 , G06N3/0475 , G06N3/094 , G10L19/16 , G10L25/18 , G10L25/24 , G10L25/30
Abstract: 本发明公开了一种基于说话人对抗子网络的语音转换方法。本发明通过在将说话人对抗子网络嵌入至语音转换模型StarGAN‑VC2中,提出了添加说话人对抗子网络辅助特征解码的策略,并融合了说话人对抗损失函数与生成器损失函数,使得二者在对抗中提高编码器的说话人身份信息去除效果,同时为了更好地适应语音转换任务,引入了自适应实例归一化算法辅助特征解码,能够有效的提升语音转换的质量以及说话人相似度,因此,使得语音在转换过程中,具有检验与反馈机制,非语义特征剔除彻底,可以在保持多对多的非平行语料转换方法优越性的前提下,创造出一个说话人身份信息去除辅助与验证机制,语音转换效果好,具有良好的应用前景。
-
公开(公告)号:CN216232654U
公开(公告)日:2022-04-08
申请号:CN202123003679.4
申请日:2021-12-02
Applicant: 南京工程学院
Abstract: 本实用新型公开了一种基于爬楼与行驶的一体化装置,涉及爬楼运输装置技术领域,该一体化装置包括:动力轮、转向机构、蜗轮蜗杆减速机、爬楼机构、升降机构、机架、电池、三角轮和单片机,所述动力轮设置于机架的前端,所述转向机构、蜗轮蜗杆减速机、升降机构、电池、三角轮均固定于机架上,所述转向机构与动力轮连接,所述蜗轮蜗杆减速机与爬楼机构连接,所述转向机构、蜗轮蜗杆减速机、升降机构、电池均与单片机连接。本实用新型的一体化装置能够帮助老人、残疾人正常上下楼及路面行驶,具有灵活性强、不易打滑、适用范围广的特点。
-
-