一种基于监督变分编码器因素分解的混合声音事件检测方法

    公开(公告)号:CN110070895A

    公开(公告)日:2019-07-30

    申请号:CN201910179592.0

    申请日:2019-03-11

    Applicant: 江苏大学

    Abstract: 本发明公开了一种基于监督变分编码器因素分解的混合声音事件检测方法,包括如下步骤:接收语音信号,并对语音信号进行预处理;提取预处理后的语音信号特征;使用监督变分自动编码器提取声音事件潜在属性空间;使用因素分解方法分解构成混合声音的各种因素,进而学习得到每个特定声音事件相关的特征表示;再使用对应的声音事件检测器检测特定声音事件是否发生。本发明采用因素分解学习的方法解决混合声音中声音事件类别较多的情况下,声音事件检测准确率不高的问题,有效提高真实场景声音事件检测的准确度,且该方法还可用于说话人识别等任务。

    一种基于监督变分编码器因素分解的混合声音事件检测方法

    公开(公告)号:CN110070895B

    公开(公告)日:2021-06-22

    申请号:CN201910179592.0

    申请日:2019-03-11

    Applicant: 江苏大学

    Abstract: 本发明公开了一种基于监督变分编码器因素分解的混合声音事件检测方法,包括如下步骤:接收语音信号,并对语音信号进行预处理;提取预处理后的语音信号特征;使用监督变分自动编码器提取声音事件潜在属性空间;使用因素分解方法分解构成混合声音的各种因素,进而学习得到每个特定声音事件相关的特征表示;再使用对应的声音事件检测器检测特定声音事件是否发生。本发明采用因素分解学习的方法解决混合声音中声音事件类别较多的情况下,声音事件检测准确率不高的问题,有效提高真实场景声音事件检测的准确度,且该方法还可用于说话人识别等任务。

Patent Agency Ranking