-
公开(公告)号:CN116386599A
公开(公告)日:2023-07-04
申请号:CN202310369908.9
申请日:2023-04-10
Applicant: 桂林电子科技大学
Abstract: 本发明属于声音场景分类领域,具体是指一种基于多种设备有监督域自适应的声场景分类方法,其特征在于,包括如下步骤,S1:对场景音频信号进行预处理;S2:进行傅里叶变换,进行梅尔滤波处理,再进行频段标准化修正,提取三个特征频谱图,融合三个特征频谱图得到三维声学特征。S3:将步骤S2得到的三维声学特征输入数据增强模块,得到经过数据增强后的三维声学特征;S4:构建有监督域自适应声场景分类模型;S5:进行有监督训练,得到训练好的有监督域自适应声场景分类模型;S6:得到分类结果。本发明具有结构简单、分类效果好、适应范围广的优点。
-
公开(公告)号:CN119649838A
公开(公告)日:2025-03-18
申请号:CN202411805209.5
申请日:2024-12-10
Applicant: 桂林电子科技大学
IPC: G10L21/0232 , G10L21/0224 , G10L21/0264 , G10L25/18 , G10L25/30 , G06N3/0442 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于两阶段深度复数网络的多通道噪声抑制方法,包括构建深度复数门控卷积注意网络,对复数频谱进行相关性建模;利用两阶段深度复数网络对多通道带噪信号进行增强;在波束形成阶段,对多通道复频谱进行幅度和相位增强,得到粗降噪的单通道复频谱;在后置滤波阶段对粗降噪的单通道复频谱进行细化处理,进一步抑制噪声。本发明方法通过两阶段增强策略将噪声抑制任务分为波束形成和后置滤波两个阶段,有效地避免了噪声残留和目标声信号失真的问题,此外,通过在两阶段网络中均采用复数的网络结构对复数频谱进行建模,同时增强了信号的幅度和相位信息,减少了相位失真,提升了信号的质量和自然度。
-