-
公开(公告)号:CN118298857A
公开(公告)日:2024-07-05
申请号:CN202410403378.X
申请日:2024-04-03
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种基于语音信号及对比学习的抑郁检测方法,属于语音处理及模式识别领域。该方法包括:收集抑郁语音目标数据集和常规语音背景数据集,并对音频文件进行预处理;分别对抑郁语音目标数据集和常规语音背景数据集提取多模态语音特征,至少包括声谱图特征和梅尔频率倒谱系数特征;将抑郁语音目标数据集和常规语音背景数据集提取得到的多模态语音特征输入对比变分自编码器以训练优化对比变分自编码器;将抑郁语音目标数据集提取的多模态语音特征输入优化后的对比变分自编码器进行分解,得到背景干扰变量和抑郁程度变量,抑郁程度变量经过解码得到去背景抑郁重构特征;将去背景抑郁重构特征通过深度学习分类检测网络获得抑郁评估结果。
-
公开(公告)号:CN118298856A
公开(公告)日:2024-07-05
申请号:CN202410403377.5
申请日:2024-04-03
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种基于迁移学习和跨场景知识的语音信号抑郁检测方法,属于语音处理及模式识别领域。该方法包括:收集跨场景语音数据集并从中提取语音生物标志物,并通过生物标志物对骨干网络进行分类训练,得到预训练的骨干网络;获取抑郁语音数据集并进行预处理;提取抑郁语音数据集的多模态语特征,至少包括声谱图和梅尔频率倒谱图;将抑郁语音数据集的声谱图和梅尔频率倒谱图进行特征级融合,并将得到的特征级融合特征输入预训练的骨干网络中进行迁移学习,得到语音复杂高维特征;通过统计函数获得统计特征向量,并对语音复杂高维特征与统计特征向量进行决策级融合;将决策级融合特征输入非线性预测网络,得到抑郁检测结果。
-