一种基于不确定度的集成自监督说话人识别方法

    公开(公告)号:CN116386646B

    公开(公告)日:2025-05-13

    申请号:CN202310476907.4

    申请日:2023-04-28

    Inventor: 季薇 杨茗淇 李云

    Abstract: 本发明属于说话人识别技术领域,公开了一种基于不确定度的集成自监督的语音学习方法,应用于说话人识别学习任务,本发明采用大量无标签数据对掩蔽自监督模型、对比自监督模型以及自回归预测自监督模型进行预训练,并将语音数据的梅尔语谱图特征结果分别输入三个自监督模型中,提取模型最后一层的输出,将其作为全连接层的输入,并将全连接层的输出经过ReLU激活函数计算得到各模型下输入语音数据的证据,通过得到的证据以及狄利克雷分布参数,计算出各个自监督模型输出的置信质量和不确定度,使用Dempster规则将三个自监督模型输出的分类决策质量集进行融合,从而得到每个类的最终概率和总体不确定度,输出最终分类结果。

    一种基于不确定度的集成自监督说话人识别方法

    公开(公告)号:CN116386646A

    公开(公告)日:2023-07-04

    申请号:CN202310476907.4

    申请日:2023-04-28

    Inventor: 季薇 杨茗淇 李云

    Abstract: 本发明属于说话人识别技术领域,公开了一种基于不确定度的集成自监督的语音学习方法,应用于说话人识别学习任务,本发明采用大量无标签数据对掩蔽自监督模型、对比自监督模型以及自回归预测自监督模型进行预训练,并将语音数据的梅尔语谱图特征结果分别输入三个自监督模型中,提取模型最后一层的输出,将其作为全连接层的输入,并将全连接层的输出经过ReLU激活函数计算得到各模型下输入语音数据的证据,通过得到的证据以及狄利克雷分布参数,计算出各个自监督模型输出的置信质量和不确定度,使用Dempster规则将三个自监督模型输出的分类决策质量集进行融合,从而得到每个类的最终概率和总体不确定度,输出最终分类结果。

    基于AdaBoost算法的帕金森病冻结步态症状关键特征参数的语音分析方法及系统

    公开(公告)号:CN114299996A

    公开(公告)日:2022-04-08

    申请号:CN202111677396.X

    申请日:2021-12-31

    Abstract: 本发明公开了一种基于AdaBoost算法的帕金森病冻结步态症状关键特征参数的语音分析方法。步骤一、采集帕金森病患者持续稳定的元音,并记录帕金森病患者是否有冻结步态症状;步骤二、对语音信号进行去噪预处理,并去除静音片段;步骤三、提取多种语音特征;步骤四、利用CART算法对原始特征进行特征选择,筛选出能够有效表征冻结步态症状信息的关键特征;步骤五、训练AdaBoost模型;步骤六、将待测语音的特征向量输入模型,得到帕金森病冻结步态症状的关键特征参数。本发明使用AdaBoost算法来进行帕金森病冻结步态症状的分析,利用集成学习提高模型精度,降低了帕金森病冻结步态症状早期分析的成本。

Patent Agency Ranking