-
公开(公告)号:CN112700763B
公开(公告)日:2024-04-16
申请号:CN202011570121.1
申请日:2020-12-26
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
IPC: G10L15/01
Abstract: 本申请提出一种语音标注质量评价方法、装置、设备及存储介质,该方法包括:获取与目标语音对应的待标注的语音识别结果,所述待标注的语音识别结果通过对所述目标语音的语音识别结果进行文本片段替换得到,其中,替换后的文本片段是相对于所述目标语音的错误文本片段;获取标注对象对所述待标注的语音识别结果进行文本标注处理得到的标注结果,所述文本标注处理为标注识别错误的文本的处理;根据所述待标注的语音识别结果以及所述标注结果,确定所述标注对象对所述目标语音进行语音标注的标注质量。上述过程实现了对标注对象的语音标注质量的自动评价,实现了对标注对象的语音标注工作的监督,利于提升标注对象语音标注质量。
-
公开(公告)号:CN114648980B
公开(公告)日:2025-02-28
申请号:CN202210203533.4
申请日:2022-03-03
Applicant: 科大讯飞股份有限公司
IPC: G10L15/02 , G10L15/06 , G10L15/26 , G10L15/08 , G10L25/06 , G10L25/51 , G06F18/24 , G06F18/25 , G06F40/211
Abstract: 本发明提供一种数据分类和语音识别方法、装置、电子设备及存储介质,其中方法包括,确定待分类数据,待分类数据包括原始语音、识别文本和修改文本;确定待分类数据在预设特征下的特征值,预设特征用于表征识别文本和修改文本之间的差异信息和用户的用户信息;基于特征值,确定待分类数据的有效性分类结果。本发明提供的方法、装置、电子设备及存储介质,能够通过获取样本数据的候选特征中各个特征值,并根据候选特征中各个特征值对应的有效标注样本数和无效标注样本数,从候选特征中选取预设特征,实现了从候选特征中去除无效特征,在不影响有效性判断准确率的情况下,能够提高判断的执行效率。
-
公开(公告)号:CN112700763A
公开(公告)日:2021-04-23
申请号:CN202011570121.1
申请日:2020-12-26
Applicant: 科大讯飞股份有限公司
IPC: G10L15/01
Abstract: 本申请提出一种语音标注质量评价方法、装置、设备及存储介质,该方法包括:获取与目标语音对应的待标注的语音识别结果,所述待标注的语音识别结果通过对所述目标语音的语音识别结果进行文本片段替换得到,其中,替换后的文本片段是相对于所述目标语音的错误文本片段;获取标注对象对所述待标注的语音识别结果进行文本标注处理得到的标注结果,所述文本标注处理为标注识别错误的文本的处理;根据所述待标注的语音识别结果以及所述标注结果,确定所述标注对象对所述目标语音进行语音标注的标注质量。上述过程实现了对标注对象的语音标注质量的自动评价,实现了对标注对象的语音标注工作的监督,利于提升标注对象语音标注质量。
-
公开(公告)号:CN114648980A
公开(公告)日:2022-06-21
申请号:CN202210203533.4
申请日:2022-03-03
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种数据分类和语音识别方法、装置、电子设备及存储介质,其中方法包括,确定待分类数据,待分类数据包括原始语音、识别文本和修改文本;确定待分类数据在预设特征下的特征值,预设特征用于表征识别文本和修改文本之间的差异信息和用户的用户信息;基于特征值,确定待分类数据的有效性分类结果。本发明提供的方法、装置、电子设备及存储介质,能够通过获取样本数据的候选特征中各个特征值,并根据候选特征中各个特征值对应的有效标注样本数和无效标注样本数,从候选特征中选取预设特征,实现了从候选特征中去除无效特征,在不影响有效性判断准确率的情况下,能够提高判断的执行效率。
-
-
-