Patent search ap:("江苏大学") AND inv:"黄多林" Page 1

1.

发明公开
一种基于监督变分编码器因素分解的混合声音事件检测方法有权转让

公开(公告)号：CN110070895A

公开(公告)日：2019-07-30

申请号：CN201910179592.0

申请日：2019-03-11

Applicant: 江苏大学

Inventor： 毛启容 , 高利剑 , 陈静静 , 黄多林 , 张飞飞 , 杨小汕 , 秦谦

IPC: G10L25/78 , G10L15/02 , G10L15/06 , G10L25/24 , G10L25/30 , G10L25/51

Abstract: 本发明公开了一种基于监督变分编码器因素分解的混合声音事件检测方法，包括如下步骤：接收语音信号，并对语音信号进行预处理；提取预处理后的语音信号特征；使用监督变分自动编码器提取声音事件潜在属性空间；使用因素分解方法分解构成混合声音的各种因素，进而学习得到每个特定声音事件相关的特征表示；再使用对应的声音事件检测器检测特定声音事件是否发生。本发明采用因素分解学习的方法解决混合声音中声音事件类别较多的情况下，声音事件检测准确率不高的问题，有效提高真实场景声音事件检测的准确度，且该方法还可用于说话人识别等任务。

2.

发明授权
一种基于监督变分编码器因素分解的混合声音事件检测方法有权转让

公开(公告)号：CN110070895B

公开(公告)日：2021-06-22

申请号：CN201910179592.0

申请日：2019-03-11

Applicant: 江苏大学

Inventor： 毛启容 , 高利剑 , 陈静静 , 黄多林 , 张飞飞 , 杨小汕 , 秦谦

IPC: G10L25/78 , G10L15/02 , G10L15/06 , G10L25/24 , G10L25/30 , G10L25/51

Abstract: 本发明公开了一种基于监督变分编码器因素分解的混合声音事件检测方法，包括如下步骤：接收语音信号，并对语音信号进行预处理；提取预处理后的语音信号特征；使用监督变分自动编码器提取声音事件潜在属性空间；使用因素分解方法分解构成混合声音的各种因素，进而学习得到每个特定声音事件相关的特征表示；再使用对应的声音事件检测器检测特定声音事件是否发生。本发明采用因素分解学习的方法解决混合声音中声音事件类别较多的情况下，声音事件检测准确率不高的问题，有效提高真实场景声音事件检测的准确度，且该方法还可用于说话人识别等任务。

Patent Agency Ranking