-
公开(公告)号:CN113961676A
公开(公告)日:2022-01-21
申请号:CN202111071917.7
申请日:2021-09-14
Applicant: 电信科学技术第五研究所有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06K9/62 , G06N3/04 , G06N3/08 , G06V10/774 , G06V10/82
Abstract: 本发明提供一种基于深度学习分类组合的语音事件提取方法,包括:对用于训练的语音信号文件进行预处理得到训练语图样本文件以及样本标签,并制作成训练数据集;采用训练数据集训练深度学习卷积神经网络模型;对待预测语音信号文件进行预处理得到若干待预测语图样本文件;将若干待预测语图样本文件输入训练好的深度学习卷积神经网络模型进行预测分类,得到若干分类结果,并将分类结果拼接为特征向量;对特征向量进行连续性处理,得到语音事件的位置信息,然后根据语音事件的位置信息从原始的待预测语音信号文件中提取语音事件。本发明使用深度学习二分类处理以及连续性算法,能够在语音信号弱或受干扰时也能有不错的提取效果。
-
公开(公告)号:CN113961676B
公开(公告)日:2024-10-29
申请号:CN202111071917.7
申请日:2021-09-14
Applicant: 电信科学技术第五研究所有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06N3/0464 , G06N3/08 , G06V10/774 , G06V10/82
Abstract: 本发明提供一种基于深度学习分类组合的语音事件提取方法,包括:对用于训练的语音信号文件进行预处理得到训练语图样本文件以及样本标签,并制作成训练数据集;采用训练数据集训练深度学习卷积神经网络模型;对待预测语音信号文件进行预处理得到若干待预测语图样本文件;将若干待预测语图样本文件输入训练好的深度学习卷积神经网络模型进行预测分类,得到若干分类结果,并将分类结果拼接为特征向量;对特征向量进行连续性处理,得到语音事件的位置信息,然后根据语音事件的位置信息从原始的待预测语音信号文件中提取语音事件。本发明使用深度学习二分类处理以及连续性算法,能够在语音信号弱或受干扰时也能有不错的提取效果。
-