-
公开(公告)号:CN116153320A
公开(公告)日:2023-05-23
申请号:CN202310179169.7
申请日:2023-02-27
Applicant: 上海交通大学
IPC: G10L19/012 , G10L19/038 , G10L19/16
Abstract: 本发明提供了一种语音信号联合降噪压缩方法和系统,包括:步骤1:基于多尺度频谱重构损失训练编码器、量化器、解码器,获得最佳降噪编码器和矢量量化器;步骤2:固定编码器和量化器,将编码器、量化器、解码器作为生成器,引入基于波形的鉴别器和基于频谱的鉴别器,基于生成损失训练最佳感知质量约束下的解码器;步骤3:在编码器上通过多次下采样进行语音信号压缩,在编码器上对语音信号进行降噪以及压缩。本发明提出的最佳训练框架存在合理的理论依据,是一个理论上最优的结构,该结构能够在编码器端实现最大可能降噪,增加了编码后的比特流中的有效信息。