一种基于混合特征的音频预警精准辨识方法

    公开(公告)号:CN116343763A

    公开(公告)日:2023-06-27

    申请号:CN202310257571.2

    申请日:2023-03-14

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于混合特征的音频预警精准辨识方法,该方法对收集到的音频语音进行分析,确定预警信号的发出时间,从而对音频预警的及时性进行准确评测。首先,采用logmmse‑谱减法进行双重降噪,将录制的语音中的噪声信息滤除;接着,使用基于短时能量的端点检测,标注出待测语音中的有效语音段;然后,对有效语音段的每帧语音提取MFCC特征和波形多项式特征;继而,分别将两种特征作为卷积神经网络两个通道的输入,将两个通道的输出相加后得到混合特征;最后,将混合特征作为softmax函数的输入,通过最大概率值确定目标语音(音频预警信号)所在的语音段,该语音段的起始位置就是预警信号的发出时间。

Patent Agency Ranking