-
公开(公告)号:CN115240699A
公开(公告)日:2022-10-25
申请号:CN202210869660.8
申请日:2022-07-21
Applicant: 电信科学技术第五研究所有限公司
IPC: G10L21/0216 , G10L21/0264 , G10L25/30
Abstract: 本发明涉及一种基于深度学习的噪声估计和语音降噪方法及系统,通过获取噪音并生成语音原始信号数据,将语音原始信号数据进行短时傅里叶变换并进行图像映射生成信号语谱图;将经过图像映射生成的信号语谱图进行语谱图切分;将通过语谱图切分生成长度为W的语谱子图中的语音事件部分进行标注,生成正负样本;将生成的正负样本整理并制作数据集;通过卷积神经网络对整理并制作的数据集进行训练;并对预测结果进行降噪处理。本发明达到的有益效果是:实现了在没有先验知识的情况下自动进行噪声的估计和降噪处理,降低了人工的成本,提高了降噪的灵活性和适应性;更易克服误去噪和过度降噪等问题减小了对噪声估计的误差。
-
公开(公告)号:CN113961676A
公开(公告)日:2022-01-21
申请号:CN202111071917.7
申请日:2021-09-14
Applicant: 电信科学技术第五研究所有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06K9/62 , G06N3/04 , G06N3/08 , G06V10/774 , G06V10/82
Abstract: 本发明提供一种基于深度学习分类组合的语音事件提取方法,包括:对用于训练的语音信号文件进行预处理得到训练语图样本文件以及样本标签,并制作成训练数据集;采用训练数据集训练深度学习卷积神经网络模型;对待预测语音信号文件进行预处理得到若干待预测语图样本文件;将若干待预测语图样本文件输入训练好的深度学习卷积神经网络模型进行预测分类,得到若干分类结果,并将分类结果拼接为特征向量;对特征向量进行连续性处理,得到语音事件的位置信息,然后根据语音事件的位置信息从原始的待预测语音信号文件中提取语音事件。本发明使用深度学习二分类处理以及连续性算法,能够在语音信号弱或受干扰时也能有不错的提取效果。
-