- 专利标题: 一种基于多音区的语音检测方法、相关装置及存储介质
-
申请号: CN202010732649.8申请日: 2020-07-27
-
公开(公告)号: CN111833899A公开(公告)日: 2020-10-27
- 发明人: 郑脊萌 , 陈联武 , 黎韦伟 , 段志毅 , 于蒙 , 苏丹 , 姜开宇
- 申请人: 腾讯科技(深圳)有限公司
- 申请人地址: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人地址: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 代理机构: 深圳市深佳知识产权代理事务所
- 代理商 李杭
- 主分类号: G10L21/028
- IPC分类号: G10L21/028 ; G10L25/27 ; G10L15/18 ; G10L15/22
摘要:
本申请公开了一种基于多音区的语音检测方法,该方法应用于人工智能领域,本申请提供的语音检测方法包括:获取N个音区内每个音区所对应的音区信息;根据每个音区所对应的音区信息,生成每个音区所对应的控制信号;采用每个音区所对应的控制信号,对每个音区所对应的语音输入信号进行处理,得到每个音区所对应的语音输出信号;根据每个音区所对应的语音输出信号,生成语音检测结果。本申请还公开了一种语音检测装置以及存储介质。本申请可基于多个音区并行处理来自不同方向的语音信号,在多声源的场景下,通过控制信号对不同方向上的语音信号进行保留或者抑制,从而能够实时分离和增强每个用户的语音,由此提升语音检测的准确度。
公开/授权文献
- CN111833899B 一种基于多音区的语音检测方法、相关装置及存储介质 公开/授权日:2022-07-26