一种基于互信息理论的自监督语音特征增强语音合成方法

    公开(公告)号:CN119964551A

    公开(公告)日:2025-05-09

    申请号:CN202510430211.7

    申请日:2025-04-08

    Applicant: 厦门大学

    Abstract: 一种基于互信息理论的自监督语音特征增强语音合成方法,涉及语音合成技术领域。该方法通过引入自监督语音特征,作为文本的声学补充,设计基于互信息最大化和最小化的信息瓶颈模块,从自监督语音特征中提取紧凑且与任务相关的自监督表示,并通过最大化文本表示与自监督表示之间的互信息,增强文本表示的声学信息,从而提高语音合成的自然度和质量。在单说话人和多说话人语音合成场景下均表现出色,且具有良好的跨语言适应性,能够有效提升不同语言环境下的语音合成质量。

Patent Agency Ranking