一种基于多音区的语音检测方法、相关装置及存储介质

发明公开

CN111833899A 一种基于多音区的语音检测方法、相关装置及存储介质有权

请登陆查看更多内容

专利标题： 一种基于多音区的语音检测方法、相关装置及存储介质
申请号： CN202010732649.8

申请日： 2020-07-27
公开(公告)号： CN111833899A

公开(公告)日： 2020-10-27
发明人: 郑脊萌 , 陈联武 , 黎韦伟 , 段志毅 , 于蒙 , 苏丹 , 姜开宇
申请人： 腾讯科技(深圳)有限公司
申请人地址： 广东省深圳市南山区高新区科技中一路腾讯大厦35层
专利权人： 腾讯科技(深圳)有限公司
当前专利权人： 腾讯科技(深圳)有限公司
当前专利权人地址： 广东省深圳市南山区高新区科技中一路腾讯大厦35层
代理机构： 深圳市深佳知识产权代理事务所
代理商 李杭
主分类号： G10L21/028
IPC分类号： G10L21/028 ; G10L25/27 ; G10L15/18 ; G10L15/22

摘要：

本申请公开了一种基于多音区的语音检测方法，该方法应用于人工智能领域，本申请提供的语音检测方法包括：获取N个音区内每个音区所对应的音区信息；根据每个音区所对应的音区信息，生成每个音区所对应的控制信号；采用每个音区所对应的控制信号，对每个音区所对应的语音输入信号进行处理，得到每个音区所对应的语音输出信号；根据每个音区所对应的语音输出信号，生成语音检测结果。本申请还公开了一种语音检测装置以及存储介质。本申请可基于多个音区并行处理来自不同方向的语音信号，在多声源的场景下，通过控制信号对不同方向上的语音信号进行保留或者抑制，从而能够实时分离和增强每个用户的语音，由此提升语音检测的准确度。

公开/授权文献

CN111833899B 一种基于多音区的语音检测方法、相关装置及存储介质公开/授权日：2022-07-26

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L21/00	为了改变语音或声音信号的质量或其可识度而处理语音或声音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号（G10L19/00优先）
G10L21/02	.语音增强，例如降低噪声或消除回声（在直线传送系统中减轻回声效应入H04B3/20；免提电话中的回声抑制入H04M9/08）
G10L21/0272	..声音信号的分离
G10L21/028	...采用声源的属性