-
公开(公告)号:CN116343763A
公开(公告)日:2023-06-27
申请号:CN202310257571.2
申请日:2023-03-14
Applicant: 东南大学
IPC: G10L15/04 , G10L21/0208 , G10L25/45 , G10L25/30 , G10L25/24
Abstract: 本发明公开了一种基于混合特征的音频预警精准辨识方法,该方法对收集到的音频语音进行分析,确定预警信号的发出时间,从而对音频预警的及时性进行准确评测。首先,采用logmmse‑谱减法进行双重降噪,将录制的语音中的噪声信息滤除;接着,使用基于短时能量的端点检测,标注出待测语音中的有效语音段;然后,对有效语音段的每帧语音提取MFCC特征和波形多项式特征;继而,分别将两种特征作为卷积神经网络两个通道的输入,将两个通道的输出相加后得到混合特征;最后,将混合特征作为softmax函数的输入,通过最大概率值确定目标语音(音频预警信号)所在的语音段,该语音段的起始位置就是预警信号的发出时间。