基于STARGAN与i向量的多对多说话人转换方法

    公开(公告)号:CN110136686A

    公开(公告)日:2019-08-16

    申请号:CN201910397833.9

    申请日:2019-05-14

    Abstract: 本发明公开了一种基于STARGAN与i向量的多对多说话人转换方法,包括训练阶段和转换阶段,使用循环对抗网络,通过降低循环对抗损失较好地提升转换后语音的个性相似度和语音质量,用STARGAN与i向量相结合来实现语音转换系统,较好地提升转换后语音的个性相似度和语音质量,特别是对于短时话语i向量具有更好的表征性能,语音转换质量更好,同时可以克服C-VAE中过平滑的问题,实现了一种高质量的语音转换方法。此外,本方法能够实现非平行文本条件下的语音转换,而且训练过程不需要任何对齐过程,提高了语音转换系统的通用性和实用性。

    基于BLSTM-CRF的地名组织名识别方法

    公开(公告)号:CN110134956A

    公开(公告)日:2019-08-16

    申请号:CN201910397611.7

    申请日:2019-05-14

    Abstract: 本发明公开了一种基于BLSTM-CRF的地名组织名识别方法,包括训练阶段和识别阶段,使用BLSTM-CRF模型,通过BLSTM能够较好地学习上下文的信息,通过CRF特有的转移特征能够考虑到输出label之间的顺序性,特别是用词特征与字特征结合作为输入特征,通过加入词特征能够更好地进行命名体的分界,提高命名体识别的精确度和召回率。此外,本方法运用基于地理位置的分词工具,分词更加精准。

    基于共享训练的多尺度StarGAN的语音转换方法

    公开(公告)号:CN111462768B

    公开(公告)日:2023-04-25

    申请号:CN202010168942.6

    申请日:2020-03-12

    Abstract: 本发明公开了一种基于共享训练的多尺度StarGAN的语音转换方法,使用多尺度StarGAN结构,在不同级别上来表示多尺度特征并且增加了每层网络的感受野范围,同时使用残差连接,缓解梯度消失的问题,使得网络能够更深层次地传播,显著地提升了转换后的语音质量,进一步使用Share‑Learning训练鉴别器和分类器的共享模块Share‑Block,不仅能够减少模型参数,而且共享模块的参数可以同时训练到,能够加快鉴别器和分类器训练过程,提升鉴别器和分类器的性能,实现了一种高质量的语音转换方法,在跨语种语音转换、电影配音、语音翻译和医疗辅助等领域有很好的应用前景。

    基于共享训练的多尺度StarGAN的语音转换方法

    公开(公告)号:CN111462768A

    公开(公告)日:2020-07-28

    申请号:CN202010168942.6

    申请日:2020-03-12

    Abstract: 本发明公开了一种基于共享训练的多尺度StarGAN的语音转换方法,使用多尺度StarGAN结构,在不同级别上来表示多尺度特征并且增加了每层网络的感受野范围,同时使用残差连接,缓解梯度消失的问题,使得网络能够更深层次地传播,显著地提升了转换后的语音质量,进一步使用Share-Learning训练鉴别器和分类器的共享模块Share-Block,不仅能够减少模型参数,而且共享模块的参数可以同时训练到,能够加快鉴别器和分类器训练过程,提升鉴别器和分类器的性能,实现了一种高质量的语音转换方法,在跨语种语音转换、电影配音、语音翻译和医疗辅助等领域有很好的应用前景。

Patent Agency Ranking