-
公开(公告)号:CN119446193A
公开(公告)日:2025-02-14
申请号:CN202411664673.7
申请日:2024-11-20
Applicant: 大连海事大学
Abstract: 本申请适用于人工智能技术领域,提供了一种基于因果隐马尔可夫模型的音频分类方法及相关设备,所述方法包括:通过Opensmile在预设音频数据集中提取各个音频数据的初始特征集;按预设规则对所述初始特征集进行筛选,得到预设目标特征集;根据所述目标特征集和与所述目标特征集对应的属性信息对预设因果隐马尔可夫模型进行训练,得到目标因果隐马尔可夫模型;通过Opensmile获取待识别音频数据的待识别特征集,并按所述预设规则对所述待识别特征集进行筛选,得到待识别目标特征集;将所述待识别目标特征集输入所述目标因果隐马尔可夫模型,得到与所述待识别音频数据对应的识别结果。
-
公开(公告)号:CN119446165A
公开(公告)日:2025-02-14
申请号:CN202411664672.2
申请日:2024-11-20
Applicant: 大连海事大学
IPC: G10L21/02 , G10L21/0208 , G10L15/06
Abstract: 本申请适用于音频处理技术领域,提供了一种音频强化方法及相关设备,所述方法包括:根据预设音频数据集构建训练集和测试集;通过所述训练集和测试集,对基于WavLM‑large模型和WWF模型构建的预设语音增强模型进行训练,得到目标语音增强模型;将待测音频数据集输入所述目标语音增强模型,得到强化音频数据集。解决了音频检测领域在数据量小且缺少成对干净语音场景下的降噪问题,消除了待测音频数据集的噪声及“Clever Hans”效应,避免了去噪导致的待测音频数据集中有效特征丢失问题。
-
公开(公告)号:CN117577306A
公开(公告)日:2024-02-20
申请号:CN202311572594.9
申请日:2023-11-22
Applicant: 大连海事大学
Abstract: 本发明公开一种基于音频和文本模态融合的阿尔茨海默症诊断系统,涉及语音处理和自然语言处理的交叉技术领域。包括:多模态融合模块:基于数据预处理模块得到的向量化表示,利用transformer编码器和多层共同注意力层进行特征学习、模态交互和特征深度学习,得到多模态交互后的特征表示;多任务学习模块:基于多模态交互后的特征表示进行多任务学习;多任务包括主任务和两个辅助任务;第一个辅助任务为模态驱动的交互增强任务;第二个辅助任务为协同模态融合任务;分类模块:利用多任务学习后的分类器对待分类的阿尔兹海默症数据进行分类,得到阿尔兹海默症数据的分类结果。本发明能够增强模态之间的有效信息交流,提高系统的性能和准确性。
-
-