一种基于深度学习的高噪环境下的声源定位和事件检测方法

    公开(公告)号:CN117953913A

    公开(公告)日:2024-04-30

    申请号:CN202410086072.6

    申请日:2024-01-22

    Applicant: 东北大学

    Abstract: 本发明的一种基于深度学习的高噪环境下的声源定位和事件检测方法是设计一个通过对含噪声音进行增强,再对其进行声源定位和事件检测分析的方法。将含噪声音提取时频域特征后送入由深度可分离卷积组成的编码器‑解码器结构网络中,编码器和解码器之间由双路循环神经网络组成,并在块内循环神经网络中加入注意力机制,使得算法可以更加关注包含较多有用信息的频率部分,尤其是在高噪场景下,能够有效减少有用信息的损失。经过前端降噪后的声音数据提取SALSA特征并进行特征增强,可以解决重叠声源问题并增加数据集多样性。然后送入加入了挤压激励模块的SELD网络中进行训练。本发明解决了在高噪场景下定位与事件检测准确度较低的问题。

Patent Agency Ranking