-
公开(公告)号:CN111640456B
公开(公告)日:2023-08-22
申请号:CN202010501971.X
申请日:2020-06-04
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明公开了一种叠音检测方法、装置和设备。本发明的核心构思在于提出一种利用将声学特征和语言学特征融合所得到的融合特征作为重叠语音段的检测特征的叠音检测方案,具体是根据融合特征得到待检测语音数据中各第一语音片段的重叠得分,然后按照时长更长的第二语音片段逐段对重叠得分进行分析,以确定各第二语音片段是否为重叠语音段。由于融合了蕴含文本信息的语言学特征,同时考虑了待检测语音数据中的声音信息和文本信息,以此作为重叠语音段的检测特征,可以提高叠音检测的准确性和鲁棒性;同时,按照第二语音片段逐段对重叠得分进行分析,可以对叠音检测结果进行顺滑,减少叠音检测结果中某些奇异点的问题,进一步提高叠音检测的准确性。
-
公开(公告)号:CN116168706A
公开(公告)日:2023-05-26
申请号:CN202310197341.1
申请日:2023-02-28
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种多系统融合的语音识别方法、装置、设备及可读存储介质。本方案中,首先获取目标语音在多个语音识别系统上分别对应的候选集,然后,对获取的多个候选集进行词级别对齐处理,得到多个候选集中各候选识别结果的对齐结果;对多个候选集中各候选识别结果的对齐结果进行词级别融合处理,得到多个候选集的融合结果;最后基于多个候选集的融合结果与多个候选集,确定目标语音的识别结果。在本方案中,每个候选识别结果的对齐结果是从多条候选对齐结果中择优选取的,对齐准确性更高,对多个候选集中各候选识别结果的对齐结果进行词级别融合处理,也更有利于得到更准确的融合结果,从而能够得到准确度更高的语音识别结果。
-
公开(公告)号:CN115188371A
公开(公告)日:2022-10-14
申请号:CN202210819897.5
申请日:2022-07-13
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明提供了一种语音识别模型训练方法、语音识别方法及相关设备,训练方法包括:利用任务总集对构建的语音识别模型进行第一阶段的训练,得到第一阶段训练后的语音识别模型,任务总集中包括多个第一类别分别对应的任务,在进行第一阶段训练的过程中,通过自行学习适合任务总集中任务的学习率来把控模型参数更新方向,通过一阶梯度的计算对模型参数进行更新;利用第二类别的训练语音,对第一阶段训练后的语音识别模型进行第二阶段的训练。采用本发明提供的语音识别模型训练方法可训练得到对第二类别的语音具有较好识别效果且具有较高稳定性的语音识别模型,利用该语音识别模型对第二类别的待识别语音进行识别,可获得准确率较高的识别结果。
-
公开(公告)号:CN111640456A
公开(公告)日:2020-09-08
申请号:CN202010501971.X
申请日:2020-06-04
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明公开了一种叠音检测方法、装置和设备。本发明的核心构思在于提出一种利用将声学特征和语言学特征融合所得到的融合特征作为重叠语音段的检测特征的叠音检测方案,具体是根据融合特征得到待检测语音数据中各第一语音片段的重叠得分,然后按照时长更长的第二语音片段逐段对重叠得分进行分析,以确定各第二语音片段是否为重叠语音段。由于融合了蕴含文本信息的语言学特征,同时考虑了待检测语音数据中的声音信息和文本信息,以此作为重叠语音段的检测特征,可以提高叠音检测的准确性和鲁棒性;同时,按照第二语音片段逐段对重叠得分进行分析,可以对叠音检测结果进行顺滑,减少叠音检测结果中某些奇异点的问题,进一步提高叠音检测的准确性。
-
公开(公告)号:CN111540363A
公开(公告)日:2020-08-14
申请号:CN202010312979.1
申请日:2020-04-20
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请提供了一种关键词模型及解码网络构建方法、检测方法及相关设备,其中,关键词模型构建方法可以包括:从源域的声学模型中抽取待检测的关键词列表中各关键词分别对应的模型信息;根据关键词列表中各关键词分别对应的模型信息,生成源域的关键词模型;利用关键词列表中各关键词的语音样本,以源域关键词模型为基础模型,训练得到目标域的关键词模型。本申请提供的关键词模型构建方法使用数量较少的关键词语音样本即可构建出性能较佳的关键词模型。
-
公开(公告)号:CN119993121A
公开(公告)日:2025-05-13
申请号:CN202510017109.4
申请日:2025-01-06
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种语种识别方法、训练方法、设备及存储介质,该方法包括:获取待识别语音数据;利用语种识别模型对待识别语音数据进行特征提取,得到待识别语音特征;利用语种识别模型基于待识别语音特征进行识别,得到第一语种识别结果,第一语种识别结果用于表征待识别语音数据所属的语种;其中,语种识别模型是至少利用约束损失调参得到的,约束损失是基于语种识别模型对第一训练集提取到的第一样本特征确定,利用约束损失调参的目标为增大不同第二语种之间的语音特征距离,缩小同一第二语种内的语音特征距离。通过上述方法,本申请能够提高对目标语种的识别准确性。
-
公开(公告)号:CN119763618A
公开(公告)日:2025-04-04
申请号:CN202510008493.1
申请日:2025-01-03
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明提供一种有效语音识别方法及装置,所述方法包括:基于有效语音识别模型,提取待识别音频数据的音频特征,并应用待识别音频数据的音频特征,从待识别音频数据中确定有效语音数据;有效语音识别模型以最小化有效预测语音与有效语音标签之间的差异,最小化样本音频数据的音频特征与加噪后样本音频数据的音频特征之间的距离,以及最大化样本音频数据的音频特征与纯噪声数据的音频特征之间的距离为训练目标,有效预测语音是有效语音识别模型对样本音频数据进行有效语音识别得到的。本发明在面对语音信噪比较小,背景噪声较大的场景下,能够准确对待识别音频数据进行有效语音识别,提高有效语音识别精度。
-
公开(公告)号:CN115223571A
公开(公告)日:2022-10-21
申请号:CN202210683340.3
申请日:2022-06-15
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种声纹提取方法、声纹识别方法及相关装置、设备和介质,其中,声纹提取方法包括:获取由目标对象的各目标语音提取到的初始声纹特征,分别与参考声纹特征之间的差值声纹特征;从若干高斯混合模型中,确定与差值声纹特征匹配的高斯混合模型,作为差值声纹特征对应的目标混合模型;基于差值声纹特征和差值声纹特征对应的目标混合模型,分析得到信道特征,并从差值声纹特征对应的初始声纹特征中剥离信道特征,得到差值声纹特征对应的优化声纹特征;基于各差值声纹特征分别对应的优化声纹特征进行特征融合,得到目标对象的最终声纹特征。上述方案,能够尽可能地削弱声纹特征中的信道噪声,以提升声纹识别的准确性。
-
公开(公告)号:CN114708854A
公开(公告)日:2022-07-05
申请号:CN202210283915.2
申请日:2022-03-21
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明提供一种语音识别方法、装置、电子设备和存储介质,所述方法包括:确定待识别语音;基于第一语音识别模型,对待识别语音的频谱特征进行声学状态预测,得到待识别语音的第一声学状态后验概率;基于第二语音识别模型,对待识别语音的语义特征进行声学状态预测,得到待识别语音的第二声学状态后验概率;融合第一声学状态后验概率和第二声学状态后验概率,基于融合得到的融合后验概率进行语音识别解码,得到待识别语音的识别文本。本发明提供的语音识别方法、装置、电子设备和存储介质,在领域场景下能够准确进行语音识别。
-
公开(公告)号:CN114708852A
公开(公告)日:2022-07-05
申请号:CN202210255584.1
申请日:2022-03-15
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明提供一种语音识别方法、装置、电子设备和存储介质,所述方法包括:将待识别语音的语音特征输入至语音识别模型,得到语音识别模型输出的识别文本;语音识别模型是基于领域样本语音的标签识别文本和第一识别文本之间的差异,以及第一识别文本和第二识别文本之间的差异,对学生模型进行参数迭代得到的;第一识别文本是学生模型基于领域样本语音的语音特征确定的,第二识别文本是教师模型基于领域样本语音的语音特征确定的,教师模型基于通用样本语音及其标签识别文本训练得到。本发明提供的语音识别方法、装置、电子设备和存储介质,在特定领域场景下能够准确进行语音识别。
-
-
-
-
-
-
-
-
-