-
公开(公告)号:CN118197322A
公开(公告)日:2024-06-14
申请号:CN202410216418.X
申请日:2024-02-27
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种声纹识别方法、模型的训练方法、相关装置及存储介质,声纹识别模型的训练方法包括:获取待训练声纹识别模型以及获取第一音频数据集,待训练声纹识别模型中最后一层分类节点包括第一数量个分类节点,待训练声纹识别模型中除最后一层节点以外的其他节点的参数与已训练的基准声纹识别模型中的参数相同;利用待训练声纹识别模型对若干第一目标对象的第一真假音训练数据进行分类,得到各待训练节点输出的各第一真假音训练数据的分类结果;基于各第一真假音训练数据的分类结果以及各第一真假音训练数据的类别标签之间的差异,调整待训练声纹识别模型中的参数。上述方案,能够提高模型对特定对象的真假音识别的准确度。
-
公开(公告)号:CN118016061A
公开(公告)日:2024-05-10
申请号:CN202410010627.9
申请日:2024-01-03
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种语音识别纠正方法、装置、设备和存储介质,其中,语音识别纠正方法包括:基于待识别语音进行识别,得到若干候选识别文本;基于若干候选识别文本,预测得到各个候选识别文本分别与待识别语音实际表达之间的差异度;基于各个候选识别文本分别对应的差异度,选择候选识别文本作为第一识别文本;基于第一识别文本进行解码,得到待识别语音的目标识别文本。上述方案,能够提升语音识别的纠正准确率。
-
公开(公告)号:CN111540363B
公开(公告)日:2023-10-24
申请号:CN202010312979.1
申请日:2020-04-20
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请提供了一种关键词模型及解码网络构建方法、检测方法及相关设备,其中,关键词模型构建方法可以包括:从源域的声学模型中抽取待检测的关键词列表中各关键词分别对应的模型信息;根据关键词列表中各关键词分别对应的模型信息,生成源域的关键词模型;利用关键词列表中各关键词的语音样本,以源域关键词模型为基础模型,训练得到目标域的关键词模型。本申请提供的关键词模型构建方法使用数量较少的关键词语音样本即可构建出性能较佳的关键词模型。
-
公开(公告)号:CN115223543A
公开(公告)日:2022-10-21
申请号:CN202210701565.7
申请日:2022-06-17
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种语种识别方法、装置、电子设备和计算机可读存储介质,该方法包括:利用第一语种识别网络对待识别音频进行语种识别,得到初始语种识别结果;检测初始语种识别结果是否满足预设识别要求;响应于初始语种识别结果不满足预设识别要求,利用第二语种识别网络对待识别音频进行语种识别,得到目标语种识别结果。通过上述方式,本申请能够准确地对不同语种情况下的音频进行语种识别。
-
公开(公告)号:CN114512116A
公开(公告)日:2022-05-17
申请号:CN202210061164.X
申请日:2022-01-19
Applicant: 合肥讯飞数码科技有限公司
Inventor: 杨军
Abstract: 本发明提供一种语种识别方法、装置、电子设备及存储介质,其中方法包括:基于骨干网络,提取待识别语音的语种特征;基于全量样本集,确定语种特征的第一识别结果;和/或,基于多个数据量分类样本集,确定语种特征的第二识别结果;基于第一识别结果和/或所述第二识别结果,确定语种识别结果。本发明提供的方法、装置、电子设备及存储介质,能够通过语音分布均衡的全量样本集训练得到的映射关系确定第一识别结果,通过多个数据量分类样本集训练得到的映射关系确定第二识别结果,提升了语种识别的分类能力,进而提高了语种的识别率,并且可以通过第一识别结合和第二识别结果联合确定语种识别结果,进一步提升了语种识别的准确率。
-
公开(公告)号:CN113724700A
公开(公告)日:2021-11-30
申请号:CN202111223156.2
申请日:2021-10-20
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明提供一种语种识别、语种识别模型训练方法及装置,所述识别方法包括:将待识别语音数据输入至语种识别模型,得到语种识别模型输出的语种识别结果;其中,语种识别模型包括语种特征提取层和语种分类层,语种识别模型是基于如下过程训练得到的:对语种特征提取层进行第一训练;固定第一训练完成后语种特征提取层的参数,基于均衡样本集对语种分类层进行第二训练,得到训练完成的语种识别模型,均衡样本集中各语种的样本语音的数量规模一致。本发明提供的语种识别、语种识别模型训练方法及装置,能够在语种分布不均衡的场景下,准确进行语种识别。
-
公开(公告)号:CN114708852B
公开(公告)日:2025-05-13
申请号:CN202210255584.1
申请日:2022-03-15
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明提供一种语音识别方法、装置、电子设备和存储介质,所述方法包括:将待识别语音的语音特征输入至语音识别模型,得到语音识别模型输出的识别文本;语音识别模型是基于领域样本语音的标签识别文本和第一识别文本之间的差异,以及第一识别文本和第二识别文本之间的差异,对学生模型进行参数迭代得到的;第一识别文本是学生模型基于领域样本语音的语音特征确定的,第二识别文本是教师模型基于领域样本语音的语音特征确定的,教师模型基于通用样本语音及其标签识别文本训练得到。本发明提供的语音识别方法、装置、电子设备和存储介质,在特定领域场景下能够准确进行语音识别。
-
公开(公告)号:CN114203169B
公开(公告)日:2025-01-24
申请号:CN202210094152.7
申请日:2022-01-26
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请提供了一种语音识别结果确定方法、装置、设备及存储介质,其中,方法包括:获取目标语音在多个语音识别系统上分别对应的候选集,其中,目标语音在一个语音识别系统上对应的候选集包括基于该语音识别系统获得的若干候选识别结果;将获取的多个候选集两两组合,以得到若干组候选集;确定若干组候选集分别对应的相似性信息,并基于若干组候选集分别对应的相似性信息,从多个候选集中确定目标语音的识别结果,其中,相似性信息为对应的两个候选集中的第一候选集包含的候选识别结果与第二候选集包含的候选识别结果的句子级别的相似性信息。通过本申请提供的语音识别结果确定方法能够较快地确定出准确度较高的语音识别结果。
-
公开(公告)号:CN119107940A
公开(公告)日:2024-12-10
申请号:CN202411344046.5
申请日:2024-09-25
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明提供一种语音识别模型的训练方法和语音识别方法,其中训练方法包括:基于语音编码网络,提取标签样本语音的语音特征,并基于解码网络解码语音特征,得到标签样本语音的对齐信息;基于文本编码网络,提取标签样本语音的标签文本的文本特征,并基于对齐信息对文本特征进行特征对齐,得到对齐文本特征,语音编码网络和文本编码网络共享部分的编码模块;基于语音特征和对齐文本特征,对语音编码网络、文本编码网络和解码网络进行参数迭代;基于参数迭代完成的语音编码网络和解码网络,构建语音识别模型。本发明提供的方法,通过多模态的训练数据的应用、以及语音编码网络和文本编码网络共享的编码模块,能够有效提升语音识别模型的泛化能力。
-
公开(公告)号:CN118748006A
公开(公告)日:2024-10-08
申请号:CN202410656002.X
申请日:2024-05-24
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请提供一种语种识别方法、装置、设备、介质及产品,该方法包括:对待识别的语音数据进行语种识别,得到语音数据对应的初始语种识别结果,初始语种识别结果包括语音数据的各个语音帧各自对应的帧级别语种识别结果;基于初始语种识别结果,确定语音数据对应的中间语种识别结果,中间语种识别结果包括语音数据中的各个语种片段;基于中间语种识别结果中的各个语种片段各自对应的帧级别语种识别结果,对各个语种片段进行合并,得到语音数据对应的语种识别结果。本申请可以提高对混合语种数据的语种识别的准确度。
-
-
-
-
-
-
-
-
-