-
公开(公告)号:CN118351872A
公开(公告)日:2024-07-16
申请号:CN202410262433.8
申请日:2024-03-07
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请提供了语种识别方法、装置、设备、存储介质及程序产品,该方法包括:获取待处理音频数据;将所述待处理音频数据输入至语种识别模型,得到所述待处理音频数据对应的目标语种;其中,所述语种识别模型是根据伪语种向量和音频样本集合中各个音频样本对应的音频特征向量进行语种识别训练得到的,其中,所述伪语种向量是对所述音频样本集合中第一音频样本对应的第一音频特征向量进行转换处理得到的,所述伪语种向量与所述音频样本集合中第二音频样本对应的第二音频特征向量的方向相同,所述第一音频样本和所述第二音频样本是不同的语种音频。根据本申请的技术方案,能够有效提升语种识别的准确性。
-
公开(公告)号:CN113724700A
公开(公告)日:2021-11-30
申请号:CN202111223156.2
申请日:2021-10-20
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明提供一种语种识别、语种识别模型训练方法及装置,所述识别方法包括:将待识别语音数据输入至语种识别模型,得到语种识别模型输出的语种识别结果;其中,语种识别模型包括语种特征提取层和语种分类层,语种识别模型是基于如下过程训练得到的:对语种特征提取层进行第一训练;固定第一训练完成后语种特征提取层的参数,基于均衡样本集对语种分类层进行第二训练,得到训练完成的语种识别模型,均衡样本集中各语种的样本语音的数量规模一致。本发明提供的语种识别、语种识别模型训练方法及装置,能够在语种分布不均衡的场景下,准确进行语种识别。
-
公开(公告)号:CN115223571A
公开(公告)日:2022-10-21
申请号:CN202210683340.3
申请日:2022-06-15
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种声纹提取方法、声纹识别方法及相关装置、设备和介质,其中,声纹提取方法包括:获取由目标对象的各目标语音提取到的初始声纹特征,分别与参考声纹特征之间的差值声纹特征;从若干高斯混合模型中,确定与差值声纹特征匹配的高斯混合模型,作为差值声纹特征对应的目标混合模型;基于差值声纹特征和差值声纹特征对应的目标混合模型,分析得到信道特征,并从差值声纹特征对应的初始声纹特征中剥离信道特征,得到差值声纹特征对应的优化声纹特征;基于各差值声纹特征分别对应的优化声纹特征进行特征融合,得到目标对象的最终声纹特征。上述方案,能够尽可能地削弱声纹特征中的信道噪声,以提升声纹识别的准确性。
-
公开(公告)号:CN115527551A
公开(公告)日:2022-12-27
申请号:CN202211139461.8
申请日:2022-09-19
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明提供一种语音标注质量评价方法、装置、电子设备和存储介质,所述方法包括:确定原始语音的标注文本;基于标注文本进行语音合成,得到合成语音;对原始语音进行语音识别,得到原始语音文本表征以及原始识别文本;对合成语音进行语音识别,得到合成语音文本表征以及合成识别文本;基于原始语音文本表征与合成语音文本表征之间的特征相似度,和/或,原始识别文本与合成识别文本之间的文本编辑距离,确定标注质量评价结果。本发明提供的语音标注质量评价方法、装置、电子设备和存储介质,能够准确确定标注质量评价结果,从而可以快速筛选出不合格的标注文本,极大提升了标注文本的核查效率,同时极大节省了人力及时间成本。
-
公开(公告)号:CN115240641A
公开(公告)日:2022-10-25
申请号:CN202210887015.9
申请日:2022-07-26
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种语种识别方法、装置、存储介质及设备,该方法包括:首先获取目标语音并提取其声学特征;然后将目标语音的声学特征输入至预先构建的语种识别模型,识别得到目标语音的语种识别结果,其中,语种识别模型中的骨干网络是利用不同语种的多信道来源的语音数据和第一目标函数共同训练得到的;注意力层和线性全连接层是基于骨干网络,利用不同语种的类平衡采样的语音数据和第二目标函数共同训练得到的。可见,本申请是先利用不同语种的多信道来源的语音数据和目标函数构建了语种识别模型,再将目标语音的声学特征输入该识别模型,既保证了各语种语音的识别准确率,又避免了因为信道干扰对识别结果产生的影响,从而提高了语种识别效果。
-
公开(公告)号:CN115050350A
公开(公告)日:2022-09-13
申请号:CN202210482241.9
申请日:2022-05-05
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种标注检查方法及相关装置、电子设备、存储介质,其中,标注检查方法包括:分别提取若干待检查语音的语种特征;其中,待检查语音标注有语种类别;基于各待检查语音的语种特征,将若干待检查语音划分到至少一个子集;基于子集中部分待检查语音的标注检查结果,得到子集的标注质量。上述方案,能够在降低检查成本、减少检查时间的同时,提升检查质量。
-
公开(公告)号:CN113724700B
公开(公告)日:2022-08-12
申请号:CN202111223156.2
申请日:2021-10-20
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明提供一种语种识别、语种识别模型训练方法及装置,所述识别方法包括:将待识别语音数据输入至语种识别模型,得到语种识别模型输出的语种识别结果;其中,语种识别模型包括语种特征提取层和语种分类层,语种识别模型是基于如下过程训练得到的:对语种特征提取层进行第一训练;固定第一训练完成后语种特征提取层的参数,基于均衡样本集对语种分类层进行第二训练,得到训练完成的语种识别模型,均衡样本集中各语种的样本语音的数量规模一致。本发明提供的语种识别、语种识别模型训练方法及装置,能够在语种分布不均衡的场景下,准确进行语种识别。
-
公开(公告)号:CN114822517A
公开(公告)日:2022-07-29
申请号:CN202210457751.0
申请日:2022-04-27
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明提供一种语音标注质量评价方法、装置、电子设备与存储介质,其中方法包括:确定样本语音的标注文本;基于所述标注文本进行语音合成,得到合成语音;基于所述样本语音和所述合成语音分别对应的声学特征,确定所述样本语音与所述合成语音之间的声学相似度;基于所述声学相似度,确定标注质量评价结果。本发明提供的方法、装置、电子设备与存储介质,通过根据样本语音和合成语音分别提取得到的声学特征,确定样本语音与合成语音之间的声学相似度,再根据声学相似度确定标注质量评价结果,从而可以实现标注文本的准确质量评价,进而可以快速筛选出不合格的标注文本,极大提升了标注文本的核查效率,同时极大节省了人力及时间成本。
-
-
-
-
-
-
-