-
公开(公告)号:CN115188371B
公开(公告)日:2025-01-24
申请号:CN202210819897.5
申请日:2022-07-13
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明提供了一种语音识别模型训练方法、语音识别方法及相关设备,训练方法包括:利用任务总集对构建的语音识别模型进行第一阶段的训练,得到第一阶段训练后的语音识别模型,任务总集中包括多个第一类别分别对应的任务,在进行第一阶段训练的过程中,通过自行学习适合任务总集中任务的学习率来把控模型参数更新方向,通过一阶梯度的计算对模型参数进行更新;利用第二类别的训练语音,对第一阶段训练后的语音识别模型进行第二阶段的训练。采用本发明提供的语音识别模型训练方法可训练得到对第二类别的语音具有较好识别效果且具有较高稳定性的语音识别模型,利用该语音识别模型对第二类别的待识别语音进行识别,可获得准确率较高的识别结果。
-
公开(公告)号:CN118230723A
公开(公告)日:2024-06-21
申请号:CN202410352728.4
申请日:2024-03-26
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种语种识别方法、模型的训练方法、相关装置及存储介质,语种识别模型的训练方法包括:获取至少一种语种的无标注语音;对各无标注语音中提取到的第一语音特征进行数据增强,得到增强后的第二语音特征;将各无标注语音的第一语音特征和第二语音特征输入至语种识别模型,得到各第一语音特征的第一语种识别结果和各第二语音特征的第二语种识别结果;基于各无标注语音对应的第一语种识别结果与第二语种识别结果之间的差异,调整语种识别模型的参数。上述方案,能够提高模型对语种识别的准确度。
-
公开(公告)号:CN111724766B
公开(公告)日:2024-01-05
申请号:CN202010607693.6
申请日:2020-06-29
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种语种识别方法、相关设备及可读存储介质,在获取待识别的语音数据之后,确定该语音数据的语种特征;利用预先建立的第一语种识别模型对该语音数据的语种特征进行第一次识别,得到第一次语种识别结果;当第一次语种识别结果不准确时,利用预先建立的第二语种识别模型对该语音数据的语种特征进行第二次识别,得到第二次语种识别结果,并基于第一次语种识别结果和第二次语种识别结果,确定该语音数据的语种。上述方案中,如果第一次语种识别结果不准确,可以利用比第一语种识别模型的网络层数多的第二语种识别模型进行第二次识别,从而提升识别准确率。
-
公开(公告)号:CN115527551A
公开(公告)日:2022-12-27
申请号:CN202211139461.8
申请日:2022-09-19
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明提供一种语音标注质量评价方法、装置、电子设备和存储介质,所述方法包括:确定原始语音的标注文本;基于标注文本进行语音合成,得到合成语音;对原始语音进行语音识别,得到原始语音文本表征以及原始识别文本;对合成语音进行语音识别,得到合成语音文本表征以及合成识别文本;基于原始语音文本表征与合成语音文本表征之间的特征相似度,和/或,原始识别文本与合成识别文本之间的文本编辑距离,确定标注质量评价结果。本发明提供的语音标注质量评价方法、装置、电子设备和存储介质,能够准确确定标注质量评价结果,从而可以快速筛选出不合格的标注文本,极大提升了标注文本的核查效率,同时极大节省了人力及时间成本。
-
公开(公告)号:CN115240641A
公开(公告)日:2022-10-25
申请号:CN202210887015.9
申请日:2022-07-26
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种语种识别方法、装置、存储介质及设备,该方法包括:首先获取目标语音并提取其声学特征;然后将目标语音的声学特征输入至预先构建的语种识别模型,识别得到目标语音的语种识别结果,其中,语种识别模型中的骨干网络是利用不同语种的多信道来源的语音数据和第一目标函数共同训练得到的;注意力层和线性全连接层是基于骨干网络,利用不同语种的类平衡采样的语音数据和第二目标函数共同训练得到的。可见,本申请是先利用不同语种的多信道来源的语音数据和目标函数构建了语种识别模型,再将目标语音的声学特征输入该识别模型,既保证了各语种语音的识别准确率,又避免了因为信道干扰对识别结果产生的影响,从而提高了语种识别效果。
-
公开(公告)号:CN115050350A
公开(公告)日:2022-09-13
申请号:CN202210482241.9
申请日:2022-05-05
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种标注检查方法及相关装置、电子设备、存储介质,其中,标注检查方法包括:分别提取若干待检查语音的语种特征;其中,待检查语音标注有语种类别;基于各待检查语音的语种特征,将若干待检查语音划分到至少一个子集;基于子集中部分待检查语音的标注检查结果,得到子集的标注质量。上述方案,能够在降低检查成本、减少检查时间的同时,提升检查质量。
-
公开(公告)号:CN113724700B
公开(公告)日:2022-08-12
申请号:CN202111223156.2
申请日:2021-10-20
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明提供一种语种识别、语种识别模型训练方法及装置,所述识别方法包括:将待识别语音数据输入至语种识别模型,得到语种识别模型输出的语种识别结果;其中,语种识别模型包括语种特征提取层和语种分类层,语种识别模型是基于如下过程训练得到的:对语种特征提取层进行第一训练;固定第一训练完成后语种特征提取层的参数,基于均衡样本集对语种分类层进行第二训练,得到训练完成的语种识别模型,均衡样本集中各语种的样本语音的数量规模一致。本发明提供的语种识别、语种识别模型训练方法及装置,能够在语种分布不均衡的场景下,准确进行语种识别。
-
公开(公告)号:CN114822517A
公开(公告)日:2022-07-29
申请号:CN202210457751.0
申请日:2022-04-27
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明提供一种语音标注质量评价方法、装置、电子设备与存储介质,其中方法包括:确定样本语音的标注文本;基于所述标注文本进行语音合成,得到合成语音;基于所述样本语音和所述合成语音分别对应的声学特征,确定所述样本语音与所述合成语音之间的声学相似度;基于所述声学相似度,确定标注质量评价结果。本发明提供的方法、装置、电子设备与存储介质,通过根据样本语音和合成语音分别提取得到的声学特征,确定样本语音与合成语音之间的声学相似度,再根据声学相似度确定标注质量评价结果,从而可以实现标注文本的准确质量评价,进而可以快速筛选出不合格的标注文本,极大提升了标注文本的核查效率,同时极大节省了人力及时间成本。
-
公开(公告)号:CN113488023B
公开(公告)日:2022-06-14
申请号:CN202110770019.4
申请日:2021-07-07
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种语种识别模型构建方法、语种识别方法,先利用第一样本语音及其实际语种、第二样本语音,针对待训练教师模型和待训练学生模型进行两阶段训练,得到待使用教师模型和待使用学生模型,以使该待使用教师模型和该待使用学生模型均具有较好的语种识别性能;再根据该待使用学生模型确定语种识别模型,以使该语种识别模型也具有较好的语种识别性能;最后,借助该语种识别模型针对待识别语音进行语种识别,得到该待识别语音的预测语种。其中,因无标签训练数据能够弥补带标签训练数据中数据分布失衡的缺陷,使得基于带标签训练数据和无标签训练数据进行构建的语种识别模型具有较好的语种识别性能,如此能够提高语种识别准确性。
-
公开(公告)号:CN111081221A
公开(公告)日:2020-04-28
申请号:CN201911342455.0
申请日:2019-12-23
Applicant: 合肥讯飞数码科技有限公司
IPC: G10L15/06
Abstract: 本申请提供了一种训练数据选择方法、装置、电子设备及计算机存储介质,首先将备选语料库中的备选声学特征数据输入基础声学模型,根据所述基础声学模型的输出确定所述备选声学特征数据对应的后验概率数据;接着,根据所述后验概率数据计算所述备选声学特征数据对应的信息熵数据;然后,根据所述信息熵数据确定所述备选声学特征数据对应的相对熵数据;最后,根据所述相对熵数据从所述备选声学特征数据中选取训练数据。可以根据信息熵数据和相对熵数据来选取对模型而言信息量较大的训练数据,从而实现少量优选的训练数据的训练效果也能满足模型的训练需求,减少对无用训练数据的重复标注,大大节省了人力物力。
-
-
-
-
-
-
-
-
-