-
公开(公告)号:CN113963228A
公开(公告)日:2022-01-21
申请号:CN202111071902.0
申请日:2021-09-14
Applicant: 电信科学技术第五研究所有限公司
IPC: G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种基于深度学习特征连接分析的语音事件提取方法,包括:对用于训练的语音信号文件进行预处理得到训练语图样本文件以及样本标签,并制作成训练数据集;采用训练数据集训练深度学习卷积神经网络模型;对待预测语音信号文件进行预处理得到包含若干待预测语图样本文件的待预测数据集;将待预测数据集输入训练好的深度学习卷积神经网络模型进行预测,并将预测结果拼接为一组特征向量;对特征向量进行特征处理,特征向量中的特征值大于设定阈值即语音事件的位置信息,根据语音事件的位置信息从待预测语音信号文件中提取语音事件。本发明能够在语音信号较弱的情况下依然能够进行识别并提取,并且用特征向量的方式来表达语音信号,其精度高。
-
公开(公告)号:CN119989053A
公开(公告)日:2025-05-13
申请号:CN202510089740.5
申请日:2025-01-21
Applicant: 电信科学技术第五研究所有限公司
IPC: G06F18/24 , H04B17/00 , G06F18/214 , G06N3/0464 , G06N3/044 , G06N3/084
Abstract: 本申请公开了一种跨接收机信号类型识别方法、装置、设备、存储介质及计算机产品,涉及机器学习技术领域,方法包括:基于构建的信号类型识别模型,对目标接收机采集信号与源接收机采集信号进行信号特征匹配,确定目标接收机采集信号与源接收机采集信号的特征差异信息,基于特征差异信息和源接收机采集信号的信号特征,修改目标接收机采集信号,获得修改后的目标接收机采集信号,将修改后的目标接收机采集信号输入至信号类型识别模型,获得信号类型识别结果。本申请通过解决不同接收机之间的采集参数差异问题,并结合时频变换与深度学习技术,有效提升了跨接收机低信噪比信号类型识别的性能。
-
公开(公告)号:CN115240699A
公开(公告)日:2022-10-25
申请号:CN202210869660.8
申请日:2022-07-21
Applicant: 电信科学技术第五研究所有限公司
IPC: G10L21/0216 , G10L21/0264 , G10L25/30
Abstract: 本发明涉及一种基于深度学习的噪声估计和语音降噪方法及系统,通过获取噪音并生成语音原始信号数据,将语音原始信号数据进行短时傅里叶变换并进行图像映射生成信号语谱图;将经过图像映射生成的信号语谱图进行语谱图切分;将通过语谱图切分生成长度为W的语谱子图中的语音事件部分进行标注,生成正负样本;将生成的正负样本整理并制作数据集;通过卷积神经网络对整理并制作的数据集进行训练;并对预测结果进行降噪处理。本发明达到的有益效果是:实现了在没有先验知识的情况下自动进行噪声的估计和降噪处理,降低了人工的成本,提高了降噪的灵活性和适应性;更易克服误去噪和过度降噪等问题减小了对噪声估计的误差。
-
公开(公告)号:CN113963228B
公开(公告)日:2024-07-02
申请号:CN202111071902.0
申请日:2021-09-14
Applicant: 电信科学技术第五研究所有限公司
IPC: G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种基于深度学习特征连接分析的语音事件提取方法,包括:对用于训练的语音信号文件进行预处理得到训练语图样本文件以及样本标签,并制作成训练数据集;采用训练数据集训练深度学习卷积神经网络模型;对待预测语音信号文件进行预处理得到包含若干待预测语图样本文件的待预测数据集;将待预测数据集输入训练好的深度学习卷积神经网络模型进行预测,并将预测结果拼接为一组特征向量;对特征向量进行特征处理,特征向量中的特征值大于设定阈值即语音事件的位置信息,根据语音事件的位置信息从待预测语音信号文件中提取语音事件。本发明能够在语音信号较弱的情况下依然能够进行识别并提取,并且用特征向量的方式来表达语音信号,其精度高。
-
-
-