-
公开(公告)号:CN112634878B
公开(公告)日:2024-05-17
申请号:CN202011476615.3
申请日:2020-12-15
Applicant: 深港产学研基地(北京大学香港科技大学深圳研修院) , 北京大学深圳研究院
IPC: G10L15/06 , G10L15/183 , G10L15/19 , G10L15/22
Abstract: 本发明公开了一种语音识别后处理方法和系统及相关设备。所述方法包括:从语音识别系统针对输入语音进行第一次解码产生的词图lattice中,提取前N个最好的识别结果N‑best lists;使用训练好的带有词性的BERT双向语言模型对N‑best lists进行重打分;从N‑best lists中选择得分最高的结果作为最终的识别结果。本发明对N‑best lists进行重打分时,通过使用带有词性的BERT双向语言模型,能够同时利用上下文信息,还可以利用到上下文的词性信息,从而可以进一步提升语音识别系统的性能。
-
公开(公告)号:CN114121023A
公开(公告)日:2022-03-01
申请号:CN202111446569.7
申请日:2021-11-30
Applicant: 深港产学研基地(北京大学香港科技大学深圳研修院)
IPC: G10L17/04
Abstract: 本申请涉及一种说话人分离方法,所述方法包括:获取待分离的语音信息,对待分离的语音信息进行初步分割,得到分离结果;对分离结果进行语音识别,得到分离语音内容,提取分离语音内容中的说话人转变点;提取分离结果的声纹特征和语义特征,并根据声纹特征和语义特征对分离结果进行说话人分类,得到标准分类结果;基于说话人转变点和标准分类结果对待分离的语音信息进行分类,得到目标分离结果。此外,本申请还涉及一种说话人分离方法、装置、设备及存储介质。本申请可解决说话人分离的准确度不够高的问题。
-
公开(公告)号:CN112634878A
公开(公告)日:2021-04-09
申请号:CN202011476615.3
申请日:2020-12-15
Applicant: 深港产学研基地(北京大学香港科技大学深圳研修院) , 北京大学深圳研究院
IPC: G10L15/06 , G10L15/183 , G10L15/19 , G10L15/22
Abstract: 本发明公开了一种语音识别后处理方法和系统及相关设备。所述方法包括:从语音识别系统针对输入语音进行第一次解码产生的词图lattice中,提取前N个最好的识别结果N‑best lists;使用训练好的带有词性的BERT双向语言模型对N‑best lists进行重打分;从N‑best lists中选择得分最高的结果作为最终的识别结果。本发明对N‑best lists进行重打分时,通过使用带有词性的BERT双向语言模型,能够同时利用上下文信息,还可以利用到上下文的词性信息,从而可以进一步提升语音识别系统的性能。
-
-