多系统融合的语音识别方法、装置、设备及可读存储介质

    公开(公告)号:CN116168706A

    公开(公告)日:2023-05-26

    申请号:CN202310197341.1

    申请日:2023-02-28

    Abstract: 本申请公开了一种多系统融合的语音识别方法、装置、设备及可读存储介质。本方案中,首先获取目标语音在多个语音识别系统上分别对应的候选集,然后,对获取的多个候选集进行词级别对齐处理,得到多个候选集中各候选识别结果的对齐结果;对多个候选集中各候选识别结果的对齐结果进行词级别融合处理,得到多个候选集的融合结果;最后基于多个候选集的融合结果与多个候选集,确定目标语音的识别结果。在本方案中,每个候选识别结果的对齐结果是从多条候选对齐结果中择优选取的,对齐准确性更高,对多个候选集中各候选识别结果的对齐结果进行词级别融合处理,也更有利于得到更准确的融合结果,从而能够得到准确度更高的语音识别结果。

    一种语音识别模型训练方法、语音识别方法及相关设备

    公开(公告)号:CN115188371A

    公开(公告)日:2022-10-14

    申请号:CN202210819897.5

    申请日:2022-07-13

    Abstract: 本发明提供了一种语音识别模型训练方法、语音识别方法及相关设备,训练方法包括:利用任务总集对构建的语音识别模型进行第一阶段的训练,得到第一阶段训练后的语音识别模型,任务总集中包括多个第一类别分别对应的任务,在进行第一阶段训练的过程中,通过自行学习适合任务总集中任务的学习率来把控模型参数更新方向,通过一阶梯度的计算对模型参数进行更新;利用第二类别的训练语音,对第一阶段训练后的语音识别模型进行第二阶段的训练。采用本发明提供的语音识别模型训练方法可训练得到对第二类别的语音具有较好识别效果且具有较高稳定性的语音识别模型,利用该语音识别模型对第二类别的待识别语音进行识别,可获得准确率较高的识别结果。

    有效语音识别方法及装置
    13.
    发明公开

    公开(公告)号:CN119763618A

    公开(公告)日:2025-04-04

    申请号:CN202510008493.1

    申请日:2025-01-03

    Abstract: 本发明提供一种有效语音识别方法及装置,所述方法包括:基于有效语音识别模型,提取待识别音频数据的音频特征,并应用待识别音频数据的音频特征,从待识别音频数据中确定有效语音数据;有效语音识别模型以最小化有效预测语音与有效语音标签之间的差异,最小化样本音频数据的音频特征与加噪后样本音频数据的音频特征之间的距离,以及最大化样本音频数据的音频特征与纯噪声数据的音频特征之间的距离为训练目标,有效预测语音是有效语音识别模型对样本音频数据进行有效语音识别得到的。本发明在面对语音信噪比较小,背景噪声较大的场景下,能够准确对待识别音频数据进行有效语音识别,提高有效语音识别精度。

    声纹提取方法、声纹识别方法及相关装置、设备和介质

    公开(公告)号:CN115223571A

    公开(公告)日:2022-10-21

    申请号:CN202210683340.3

    申请日:2022-06-15

    Abstract: 本申请公开了一种声纹提取方法、声纹识别方法及相关装置、设备和介质,其中,声纹提取方法包括:获取由目标对象的各目标语音提取到的初始声纹特征,分别与参考声纹特征之间的差值声纹特征;从若干高斯混合模型中,确定与差值声纹特征匹配的高斯混合模型,作为差值声纹特征对应的目标混合模型;基于差值声纹特征和差值声纹特征对应的目标混合模型,分析得到信道特征,并从差值声纹特征对应的初始声纹特征中剥离信道特征,得到差值声纹特征对应的优化声纹特征;基于各差值声纹特征分别对应的优化声纹特征进行特征融合,得到目标对象的最终声纹特征。上述方案,能够尽可能地削弱声纹特征中的信道噪声,以提升声纹识别的准确性。

    语音识别方法、装置、电子设备和存储介质

    公开(公告)号:CN114708854A

    公开(公告)日:2022-07-05

    申请号:CN202210283915.2

    申请日:2022-03-21

    Abstract: 本发明提供一种语音识别方法、装置、电子设备和存储介质,所述方法包括:确定待识别语音;基于第一语音识别模型,对待识别语音的频谱特征进行声学状态预测,得到待识别语音的第一声学状态后验概率;基于第二语音识别模型,对待识别语音的语义特征进行声学状态预测,得到待识别语音的第二声学状态后验概率;融合第一声学状态后验概率和第二声学状态后验概率,基于融合得到的融合后验概率进行语音识别解码,得到待识别语音的识别文本。本发明提供的语音识别方法、装置、电子设备和存储介质,在领域场景下能够准确进行语音识别。

    语音识别方法、装置、电子设备和存储介质

    公开(公告)号:CN114708852A

    公开(公告)日:2022-07-05

    申请号:CN202210255584.1

    申请日:2022-03-15

    Abstract: 本发明提供一种语音识别方法、装置、电子设备和存储介质,所述方法包括:将待识别语音的语音特征输入至语音识别模型,得到语音识别模型输出的识别文本;语音识别模型是基于领域样本语音的标签识别文本和第一识别文本之间的差异,以及第一识别文本和第二识别文本之间的差异,对学生模型进行参数迭代得到的;第一识别文本是学生模型基于领域样本语音的语音特征确定的,第二识别文本是教师模型基于领域样本语音的语音特征确定的,教师模型基于通用样本语音及其标签识别文本训练得到。本发明提供的语音识别方法、装置、电子设备和存储介质,在特定领域场景下能够准确进行语音识别。

    一种语音识别结果确定方法、装置、设备及存储介质

    公开(公告)号:CN114203169A

    公开(公告)日:2022-03-18

    申请号:CN202210094152.7

    申请日:2022-01-26

    Abstract: 本申请提供了一种语音识别结果确定方法、装置、设备及存储介质,其中,方法包括:获取目标语音在多个语音识别系统上分别对应的候选集,其中,目标语音在一个语音识别系统上对应的候选集包括基于该语音识别系统获得的若干候选识别结果;将获取的多个候选集两两组合,以得到若干组候选集;确定若干组候选集分别对应的相似性信息,并基于若干组候选集分别对应的相似性信息,从多个候选集中确定目标语音的识别结果,其中,相似性信息为对应的两个候选集中的第一候选集包含的候选识别结果与第二候选集包含的候选识别结果的句子级别的相似性信息。通过本申请提供的语音识别结果确定方法能够较快地确定出准确度较高的语音识别结果。

Patent Agency Ranking