-
公开(公告)号:CN118016061A
公开(公告)日:2024-05-10
申请号:CN202410010627.9
申请日:2024-01-03
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种语音识别纠正方法、装置、设备和存储介质,其中,语音识别纠正方法包括:基于待识别语音进行识别,得到若干候选识别文本;基于若干候选识别文本,预测得到各个候选识别文本分别与待识别语音实际表达之间的差异度;基于各个候选识别文本分别对应的差异度,选择候选识别文本作为第一识别文本;基于第一识别文本进行解码,得到待识别语音的目标识别文本。上述方案,能够提升语音识别的纠正准确率。
-
公开(公告)号:CN115188371B
公开(公告)日:2025-01-24
申请号:CN202210819897.5
申请日:2022-07-13
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明提供了一种语音识别模型训练方法、语音识别方法及相关设备,训练方法包括:利用任务总集对构建的语音识别模型进行第一阶段的训练,得到第一阶段训练后的语音识别模型,任务总集中包括多个第一类别分别对应的任务,在进行第一阶段训练的过程中,通过自行学习适合任务总集中任务的学习率来把控模型参数更新方向,通过一阶梯度的计算对模型参数进行更新;利用第二类别的训练语音,对第一阶段训练后的语音识别模型进行第二阶段的训练。采用本发明提供的语音识别模型训练方法可训练得到对第二类别的语音具有较好识别效果且具有较高稳定性的语音识别模型,利用该语音识别模型对第二类别的待识别语音进行识别,可获得准确率较高的识别结果。
-
公开(公告)号:CN118230723A
公开(公告)日:2024-06-21
申请号:CN202410352728.4
申请日:2024-03-26
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种语种识别方法、模型的训练方法、相关装置及存储介质,语种识别模型的训练方法包括:获取至少一种语种的无标注语音;对各无标注语音中提取到的第一语音特征进行数据增强,得到增强后的第二语音特征;将各无标注语音的第一语音特征和第二语音特征输入至语种识别模型,得到各第一语音特征的第一语种识别结果和各第二语音特征的第二语种识别结果;基于各无标注语音对应的第一语种识别结果与第二语种识别结果之间的差异,调整语种识别模型的参数。上述方案,能够提高模型对语种识别的准确度。
-
公开(公告)号:CN115240641A
公开(公告)日:2022-10-25
申请号:CN202210887015.9
申请日:2022-07-26
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种语种识别方法、装置、存储介质及设备,该方法包括:首先获取目标语音并提取其声学特征;然后将目标语音的声学特征输入至预先构建的语种识别模型,识别得到目标语音的语种识别结果,其中,语种识别模型中的骨干网络是利用不同语种的多信道来源的语音数据和第一目标函数共同训练得到的;注意力层和线性全连接层是基于骨干网络,利用不同语种的类平衡采样的语音数据和第二目标函数共同训练得到的。可见,本申请是先利用不同语种的多信道来源的语音数据和目标函数构建了语种识别模型,再将目标语音的声学特征输入该识别模型,既保证了各语种语音的识别准确率,又避免了因为信道干扰对识别结果产生的影响,从而提高了语种识别效果。
-
公开(公告)号:CN119763617A
公开(公告)日:2025-04-04
申请号:CN202411674966.3
申请日:2024-11-21
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明提供一种有效语音检测方法及装置,所述方法包括:基于特征提取模型,提取待检测音频信号的音频特征;基于第一有效语音识别模型,应用音频特征,确定音频信号中的有效语音信号;特征提取模型和第一有效语音识别模型构成第一检测模型,第一检测模型在训练阶段与语音理解模型联合训练,语音理解模型以特征提取模型提取的音频特征作为输入,用于预测语音内容,联合训练的总损失值包括第一检测模型的有效语音检测损失值以及语音理解模型的语音理解损失值。本发明通过语音理解任务辅助训练第一检测模型,可以避免第一检测模型漏检有效语音,也即提升第一检测模型检测有效语音能力。
-
公开(公告)号:CN118351872A
公开(公告)日:2024-07-16
申请号:CN202410262433.8
申请日:2024-03-07
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请提供了语种识别方法、装置、设备、存储介质及程序产品,该方法包括:获取待处理音频数据;将所述待处理音频数据输入至语种识别模型,得到所述待处理音频数据对应的目标语种;其中,所述语种识别模型是根据伪语种向量和音频样本集合中各个音频样本对应的音频特征向量进行语种识别训练得到的,其中,所述伪语种向量是对所述音频样本集合中第一音频样本对应的第一音频特征向量进行转换处理得到的,所述伪语种向量与所述音频样本集合中第二音频样本对应的第二音频特征向量的方向相同,所述第一音频样本和所述第二音频样本是不同的语种音频。根据本申请的技术方案,能够有效提升语种识别的准确性。
-
公开(公告)号:CN114708852B
公开(公告)日:2025-05-13
申请号:CN202210255584.1
申请日:2022-03-15
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明提供一种语音识别方法、装置、电子设备和存储介质,所述方法包括:将待识别语音的语音特征输入至语音识别模型,得到语音识别模型输出的识别文本;语音识别模型是基于领域样本语音的标签识别文本和第一识别文本之间的差异,以及第一识别文本和第二识别文本之间的差异,对学生模型进行参数迭代得到的;第一识别文本是学生模型基于领域样本语音的语音特征确定的,第二识别文本是教师模型基于领域样本语音的语音特征确定的,教师模型基于通用样本语音及其标签识别文本训练得到。本发明提供的语音识别方法、装置、电子设备和存储介质,在特定领域场景下能够准确进行语音识别。
-
公开(公告)号:CN114203169B
公开(公告)日:2025-01-24
申请号:CN202210094152.7
申请日:2022-01-26
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请提供了一种语音识别结果确定方法、装置、设备及存储介质,其中,方法包括:获取目标语音在多个语音识别系统上分别对应的候选集,其中,目标语音在一个语音识别系统上对应的候选集包括基于该语音识别系统获得的若干候选识别结果;将获取的多个候选集两两组合,以得到若干组候选集;确定若干组候选集分别对应的相似性信息,并基于若干组候选集分别对应的相似性信息,从多个候选集中确定目标语音的识别结果,其中,相似性信息为对应的两个候选集中的第一候选集包含的候选识别结果与第二候选集包含的候选识别结果的句子级别的相似性信息。通过本申请提供的语音识别结果确定方法能够较快地确定出准确度较高的语音识别结果。
-
公开(公告)号:CN119107940A
公开(公告)日:2024-12-10
申请号:CN202411344046.5
申请日:2024-09-25
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明提供一种语音识别模型的训练方法和语音识别方法,其中训练方法包括:基于语音编码网络,提取标签样本语音的语音特征,并基于解码网络解码语音特征,得到标签样本语音的对齐信息;基于文本编码网络,提取标签样本语音的标签文本的文本特征,并基于对齐信息对文本特征进行特征对齐,得到对齐文本特征,语音编码网络和文本编码网络共享部分的编码模块;基于语音特征和对齐文本特征,对语音编码网络、文本编码网络和解码网络进行参数迭代;基于参数迭代完成的语音编码网络和解码网络,构建语音识别模型。本发明提供的方法,通过多模态的训练数据的应用、以及语音编码网络和文本编码网络共享的编码模块,能够有效提升语音识别模型的泛化能力。
-
公开(公告)号:CN118748006A
公开(公告)日:2024-10-08
申请号:CN202410656002.X
申请日:2024-05-24
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请提供一种语种识别方法、装置、设备、介质及产品,该方法包括:对待识别的语音数据进行语种识别,得到语音数据对应的初始语种识别结果,初始语种识别结果包括语音数据的各个语音帧各自对应的帧级别语种识别结果;基于初始语种识别结果,确定语音数据对应的中间语种识别结果,中间语种识别结果包括语音数据中的各个语种片段;基于中间语种识别结果中的各个语种片段各自对应的帧级别语种识别结果,对各个语种片段进行合并,得到语音数据对应的语种识别结果。本申请可以提高对混合语种数据的语种识别的准确度。
-
-
-
-
-
-
-
-
-