一种基于多种设备有监督域自适应的声场景分类方法

    公开(公告)号:CN116386599A

    公开(公告)日:2023-07-04

    申请号:CN202310369908.9

    申请日:2023-04-10

    Abstract: 本发明属于声音场景分类领域,具体是指一种基于多种设备有监督域自适应的声场景分类方法,其特征在于,包括如下步骤,S1:对场景音频信号进行预处理;S2:进行傅里叶变换,进行梅尔滤波处理,再进行频段标准化修正,提取三个特征频谱图,融合三个特征频谱图得到三维声学特征。S3:将步骤S2得到的三维声学特征输入数据增强模块,得到经过数据增强后的三维声学特征;S4:构建有监督域自适应声场景分类模型;S5:进行有监督训练,得到训练好的有监督域自适应声场景分类模型;S6:得到分类结果。本发明具有结构简单、分类效果好、适应范围广的优点。

Patent Agency Ranking