一种面向低资源设备的轻量级声学模型

    公开(公告)号:CN119580687A

    公开(公告)日:2025-03-07

    申请号:CN202411418583.X

    申请日:2024-10-12

    Inventor: 韩纪庆 类海越

    Abstract: 本发明涉及语音合成技术,具体涉及一种面向低资源设备的轻量级声学模型。由于嵌入式设备的计算资源,内存和存储空间等都是有限的,因此需要考虑模型的轻量化设计,在保持语音合成质量的前提下,降低模型的复杂性和资源消耗。本发明针对FastSpeech2声学模型在低资源设备上推理速度较慢的问题进行分析和改进,提出FRSpeech模型,采用完全卷积的网络结构,使用更简单、训练速度更快的基于残差卷积块的编解码器结构。通过适当设计卷积残差块的结构,可以使其具有足够的表征能力来捕捉输入序列中的重要信息,从而保持或提高模型的性能,并且使得模型具有较少的参数量,从而简化模型,能够在算力资源和内存资源都有限的设备上实现快速推理。

Patent Agency Ranking