-
公开(公告)号:CN117219109A
公开(公告)日:2023-12-12
申请号:CN202311342274.4
申请日:2023-10-17
Applicant: 南京邮电大学
IPC: G10L21/0216 , G10L21/0264 , G10L25/30 , G10L25/03 , G06N3/0464 , G06N3/044 , G06N3/08
Abstract: 本发明公开一种基于结构化状态空间序列模型的双分支语音增强算法,包括:获取含噪语音的幅度谱和复数谱特征,并将其分别输入幅度粗略估计分支和复数细化估计分支,得到粗略估计的语音和细化之后的语音的实虚分量;引入交互模块实现幅度谱和复数谱特征在两分支之间的流动;将粗略估计的语音和细化之后的语音的实虚分量叠加,重建目标信号复数谱;对基于结构化状态空间序列模型的双分支增强算法进行性能评估。本发明同时估计幅度谱和复数谱并引入交互模块促进信息交流,使从一个分支学习到的特征能补充另一个分支缺失的信息;本发明使用一种对角化的状态空间模型对语音特征序列进行建模,既减少模型的参数量,又提升算法性能。