一种语种识别方法、装置、存储介质及设备

    公开(公告)号:CN115240641A

    公开(公告)日:2022-10-25

    申请号:CN202210887015.9

    申请日:2022-07-26

    Abstract: 本申请公开了一种语种识别方法、装置、存储介质及设备,该方法包括:首先获取目标语音并提取其声学特征;然后将目标语音的声学特征输入至预先构建的语种识别模型,识别得到目标语音的语种识别结果,其中,语种识别模型中的骨干网络是利用不同语种的多信道来源的语音数据和第一目标函数共同训练得到的;注意力层和线性全连接层是基于骨干网络,利用不同语种的类平衡采样的语音数据和第二目标函数共同训练得到的。可见,本申请是先利用不同语种的多信道来源的语音数据和目标函数构建了语种识别模型,再将目标语音的声学特征输入该识别模型,既保证了各语种语音的识别准确率,又避免了因为信道干扰对识别结果产生的影响,从而提高了语种识别效果。

    语种识别、语种识别模型训练方法及装置

    公开(公告)号:CN113724700B

    公开(公告)日:2022-08-12

    申请号:CN202111223156.2

    申请日:2021-10-20

    Abstract: 本发明提供一种语种识别、语种识别模型训练方法及装置,所述识别方法包括:将待识别语音数据输入至语种识别模型,得到语种识别模型输出的语种识别结果;其中,语种识别模型包括语种特征提取层和语种分类层,语种识别模型是基于如下过程训练得到的:对语种特征提取层进行第一训练;固定第一训练完成后语种特征提取层的参数,基于均衡样本集对语种分类层进行第二训练,得到训练完成的语种识别模型,均衡样本集中各语种的样本语音的数量规模一致。本发明提供的语种识别、语种识别模型训练方法及装置,能够在语种分布不均衡的场景下,准确进行语种识别。

    声纹提取方法、声纹识别方法及相关装置、设备和介质

    公开(公告)号:CN115223571A

    公开(公告)日:2022-10-21

    申请号:CN202210683340.3

    申请日:2022-06-15

    Abstract: 本申请公开了一种声纹提取方法、声纹识别方法及相关装置、设备和介质,其中,声纹提取方法包括:获取由目标对象的各目标语音提取到的初始声纹特征,分别与参考声纹特征之间的差值声纹特征;从若干高斯混合模型中,确定与差值声纹特征匹配的高斯混合模型,作为差值声纹特征对应的目标混合模型;基于差值声纹特征和差值声纹特征对应的目标混合模型,分析得到信道特征,并从差值声纹特征对应的初始声纹特征中剥离信道特征,得到差值声纹特征对应的优化声纹特征;基于各差值声纹特征分别对应的优化声纹特征进行特征融合,得到目标对象的最终声纹特征。上述方案,能够尽可能地削弱声纹特征中的信道噪声,以提升声纹识别的准确性。

    水声目标识别方法、装置、设备、介质及产品

    公开(公告)号:CN119541532A

    公开(公告)日:2025-02-28

    申请号:CN202411437680.3

    申请日:2024-10-15

    Abstract: 本申请提出一种水声目标识别方法、装置、设备、介质及产品,该方法通过获取待识别的水声频谱信号对应的局部特征和全局特征,局部特征为对水声频谱信号中不同频段的频谱信号采用不同的特征提取尺度进行特征提取得到;将局部特征和全局特征进行融合,得到多尺度水声特征;基于多尺度水声特征进行水声目标识别,得到水声目标识别结果。本申请能够提高水声目标识别的准确率。

    语种识别、语种识别模型训练方法及装置

    公开(公告)号:CN113724700A

    公开(公告)日:2021-11-30

    申请号:CN202111223156.2

    申请日:2021-10-20

    Abstract: 本发明提供一种语种识别、语种识别模型训练方法及装置,所述识别方法包括:将待识别语音数据输入至语种识别模型,得到语种识别模型输出的语种识别结果;其中,语种识别模型包括语种特征提取层和语种分类层,语种识别模型是基于如下过程训练得到的:对语种特征提取层进行第一训练;固定第一训练完成后语种特征提取层的参数,基于均衡样本集对语种分类层进行第二训练,得到训练完成的语种识别模型,均衡样本集中各语种的样本语音的数量规模一致。本发明提供的语种识别、语种识别模型训练方法及装置,能够在语种分布不均衡的场景下,准确进行语种识别。

Patent Agency Ranking