-
公开(公告)号:CN112528894B
公开(公告)日:2024-05-31
申请号:CN202011496118.X
申请日:2020-12-17
Applicant: 科大讯飞股份有限公司
IPC: G06V30/418 , G06V30/19
Abstract: 本申请公开了一种差异项判别方法及装置,该方法包括:获取第一单句的识别结果与第二单句的识别结果中的目标差异项,目标差异项包括第一差异文本和第二差异文本,第一单句包括公共项和第一差异文本,第二单句包括公共项和第二差异文本;基于语言预测模型以及公共项确定第一差异文本对应的第一概率和第二差异文本对应的第二概率;根据第一概率和第二概率,判断目标差异项是否为真正的差异项。实施本申请,能够有效判别真正的差异项,实现对因OCR识别错误导致的非真正的差异项的过滤,从而提高了单句对比的准确率。
-
公开(公告)号:CN113035175A
公开(公告)日:2021-06-25
申请号:CN202110229318.7
申请日:2021-03-02
Applicant: 科大讯飞股份有限公司
IPC: G10L15/06 , G10L15/26 , G06F16/35 , G06F40/126
Abstract: 本申请公开了一种语音文本重写模型构建方法、语音识别方法,先利用样本语音的至少一个样本基础识别文本、样本标准识别文本、样本上文信息以及重写分类实际结果对待训练文本重写模型进行两阶段训练,得到语音文本重写模型,以使该语音文本重写模型具有较好地预测性能,以便在对目标用户输入的待识别语音进行语音识别得到至少一个待校正识别文本之后,可以由该语音文本重写模型根据该至少一个待校正识别文本以及该待识别语音的上文信息进行语音识别文本重写,得到并输出该待识别语音的目标语音识别文本,以使该目标语音识别文本能够更准确地表示出待识别语音携带的语音信息,如此能够提高语音识别准确性。
-
公开(公告)号:CN113035175B
公开(公告)日:2024-04-12
申请号:CN202110229318.7
申请日:2021-03-02
Applicant: 科大讯飞股份有限公司
IPC: G10L15/06 , G10L15/26 , G06F16/35 , G06F40/126
Abstract: 本申请公开了一种语音文本重写模型构建方法、语音识别方法,先利用样本语音的至少一个样本基础识别文本、样本标准识别文本、样本上文信息以及重写分类实际结果对待训练文本重写模型进行两阶段训练,得到语音文本重写模型,以使该语音文本重写模型具有较好地预测性能,以便在对目标用户输入的待识别语音进行语音识别得到至少一个待校正识别文本之后,可以由该语音文本重写模型根据该至少一个待校正识别文本以及该待识别语音的上文信息进行语音识别文本重写,得到并输出该待识别语音的目标语音识别文本,以使该目标语音识别文本能够更准确地表示出待识别语音携带的语音信息,如此能够提高语音识别准确性。
-
公开(公告)号:CN112528894A
公开(公告)日:2021-03-19
申请号:CN202011496118.X
申请日:2020-12-17
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种差异项判别方法及装置,该方法包括:获取第一单句的识别结果与第二单句的识别结果中的目标差异项,目标差异项包括第一差异文本和第二差异文本,第一单句包括公共项和第一差异文本,第二单句包括公共项和第二差异文本;基于语言预测模型以及公共项确定第一差异文本对应的第一概率和第二差异文本对应的第二概率;根据第一概率和第二概率,判断目标差异项是否为真正的差异项。实施本申请,能够有效判别真正的差异项,实现对因OCR识别错误导致的非真正的差异项的过滤,从而提高了单句对比的准确率。
-
-
-