-
公开(公告)号:CN114121023A
公开(公告)日:2022-03-01
申请号:CN202111446569.7
申请日:2021-11-30
Applicant: 深港产学研基地(北京大学香港科技大学深圳研修院)
IPC: G10L17/04
Abstract: 本申请涉及一种说话人分离方法,所述方法包括:获取待分离的语音信息,对待分离的语音信息进行初步分割,得到分离结果;对分离结果进行语音识别,得到分离语音内容,提取分离语音内容中的说话人转变点;提取分离结果的声纹特征和语义特征,并根据声纹特征和语义特征对分离结果进行说话人分类,得到标准分类结果;基于说话人转变点和标准分类结果对待分离的语音信息进行分类,得到目标分离结果。此外,本申请还涉及一种说话人分离方法、装置、设备及存储介质。本申请可解决说话人分离的准确度不够高的问题。
-
公开(公告)号:CN112634878A
公开(公告)日:2021-04-09
申请号:CN202011476615.3
申请日:2020-12-15
Applicant: 深港产学研基地(北京大学香港科技大学深圳研修院) , 北京大学深圳研究院
IPC: G10L15/06 , G10L15/183 , G10L15/19 , G10L15/22
Abstract: 本发明公开了一种语音识别后处理方法和系统及相关设备。所述方法包括:从语音识别系统针对输入语音进行第一次解码产生的词图lattice中,提取前N个最好的识别结果N‑best lists;使用训练好的带有词性的BERT双向语言模型对N‑best lists进行重打分;从N‑best lists中选择得分最高的结果作为最终的识别结果。本发明对N‑best lists进行重打分时,通过使用带有词性的BERT双向语言模型,能够同时利用上下文信息,还可以利用到上下文的词性信息,从而可以进一步提升语音识别系统的性能。
-
公开(公告)号:CN112579666A
公开(公告)日:2021-03-30
申请号:CN202011476684.4
申请日:2020-12-15
Applicant: 深港产学研基地(北京大学香港科技大学深圳研修院) , 北京大学深圳研究院
IPC: G06F16/2458 , G06F16/332 , G06F16/35
Abstract: 本发明公开了一种智能问答系统和方法及相关设备。系统包括:问题分析子系统,用于生成问题描述文本,识别问题类型,即事实型、是非型、定义型;知识库生成子系统,用于将事实型、是非型的知识数据,整理成实体四元组,形成知识条;将定义型的知识数据,整理成问题答案配对形式并结合文本特征向量,形成知识条;答案抽取及生成子系统,用于对事实型、是非型的问题,分析得出实体四元组,进行检索匹配得到答案;对定义型的问题,进行向量化处理和特征向量相似度计算得到答案。本发明通过进行问题分类,分别利用数据库查询和特征向量相似度计算进行匹配,回答问题更加准确;知识内容库采用结构化的知识条形式,可减少储存量,检索效率更高更方便。
-
-