-
公开(公告)号:CN119446193A
公开(公告)日:2025-02-14
申请号:CN202411664673.7
申请日:2024-11-20
Applicant: 大连海事大学
Abstract: 本申请适用于人工智能技术领域,提供了一种基于因果隐马尔可夫模型的音频分类方法及相关设备,所述方法包括:通过Opensmile在预设音频数据集中提取各个音频数据的初始特征集;按预设规则对所述初始特征集进行筛选,得到预设目标特征集;根据所述目标特征集和与所述目标特征集对应的属性信息对预设因果隐马尔可夫模型进行训练,得到目标因果隐马尔可夫模型;通过Opensmile获取待识别音频数据的待识别特征集,并按所述预设规则对所述待识别特征集进行筛选,得到待识别目标特征集;将所述待识别目标特征集输入所述目标因果隐马尔可夫模型,得到与所述待识别音频数据对应的识别结果。
-
公开(公告)号:CN119446165A
公开(公告)日:2025-02-14
申请号:CN202411664672.2
申请日:2024-11-20
Applicant: 大连海事大学
IPC: G10L21/02 , G10L21/0208 , G10L15/06
Abstract: 本申请适用于音频处理技术领域,提供了一种音频强化方法及相关设备,所述方法包括:根据预设音频数据集构建训练集和测试集;通过所述训练集和测试集,对基于WavLM‑large模型和WWF模型构建的预设语音增强模型进行训练,得到目标语音增强模型;将待测音频数据集输入所述目标语音增强模型,得到强化音频数据集。解决了音频检测领域在数据量小且缺少成对干净语音场景下的降噪问题,消除了待测音频数据集的噪声及“Clever Hans”效应,避免了去噪导致的待测音频数据集中有效特征丢失问题。
-