-
公开(公告)号:CN115410559A
公开(公告)日:2022-11-29
申请号:CN202211110266.2
申请日:2022-09-13
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供一种语音识别方法、装置、电子设备及存储介质,其中,所述语音识别方法,包括:从待识别的发言语音中提取声纹特征;根据所述声纹特征,判断所述发言语音对应的第一发言人是否具有语音转写权限;如果所述发言语音对应的第一发言人具有语音转写权限,则对所述发言语音进行语音识别处理,得到所述第一发言人的发言文本。该方案能够灵活决策是否对发言人的发言语音进行语音识别处理,从而提高了语音识别的灵活度,有利于缓解语音识别资源紧张和识别资源浪费的问题。
-
公开(公告)号:CN120071903A
公开(公告)日:2025-05-30
申请号:CN202510534862.0
申请日:2025-04-27
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音转写系统评测方法、装置、相关设备及程序产品,涉及语音识别技术领域。本申请在对语音转写系统进行评测时,引入了语义一致性指标,该指标能够衡量测试音频的第一转写文本,与参考文本之间的语义一致性,也即衡量第一转写文本和参考文本在语义层面表达意思一致的程度,能够准确衡量语音转写系统对测试音频语义传递的能力,进而至少根据语义一致性指标得分,确定语音转写系统的评测结果,提升了评测结果的客观性。同时,语义一致性评测指标也更加符合人类真实的阅读感受,因此得到的评测结果也更加符合人类的真实感受。
-
公开(公告)号:CN114357979A
公开(公告)日:2022-04-15
申请号:CN202111672294.9
申请日:2021-12-31
Applicant: 科大讯飞股份有限公司
IPC: G06F40/226 , G06F40/232 , G06F40/211 , G06F40/289 , G10L15/26
Abstract: 本申请公开了一种字幕制作方法及装置、计算机可读存储介质,属于自然语言处理技术领域。所述字幕制作方法先获得音频文件对应的第一转写文本,再对第一转写文本中对应当前时刻之前的部分进行文本校正,以获得第一校正文本,再利用第一校正文本获得历史校正信息,再利用历史校正信息更新第一转写文本中对应当前时刻之后的部分,以获得字幕校正文本。本申请使得当前时刻之后的部分基于校正历史信息被修改,从而降低相关错误再次出现的几率。且随着历史校正信息的积累,被更新后的第一转写文本中的文本错误率将逐渐降低,从而提高语音转写的准确率,并减少字幕校正的工作量。本申请能够提高字幕制作的效率。
-
-