-
公开(公告)号:CN110164446B
公开(公告)日:2023-06-30
申请号:CN201810689667.5
申请日:2018-06-28
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G10L15/26 , G10L21/0216
摘要: 本申请涉及一种语音信号识别方法、装置、计算机设备和电子设备,方法包括:接收麦克风阵列采集的音频信号;将音频信号在设定的多个不同目标方向分别进行波束成形处理,得到对应的多路波束信号;分别对每路波束信号进行语音识别,得到各路波束信号的语音识别结果;根据各路波束信号的语音识别结果,确定音频信号的语音识别结果。该方法无需考虑声源角度,通过在不同目标方向进行波束成形处理,那么至少一个目标方向与语音信号产生方向接近,因而至少一个在目标方向进行增强后的波束信号是清楚地,因而根据各波束信号进行语音识别,能够提高在该方向上对音频信号进行识别的准确度。
-
公开(公告)号:CN110164431B
公开(公告)日:2023-01-06
申请号:CN201811361659.4
申请日:2018-11-15
申请人: 腾讯科技(深圳)有限公司
摘要: 本发明实施例提供了一种音频数据处理方法及装置、存储介质,该方法包括:获取语音检测模型,所述语音检测模型为具有历史积累特性的至少一个检测通路的音频数据和语音识别结果的对应关系;基于检测到的所述至少一个检测通路的数量,确定参考对象;所述参考对象为进行重置操作判断的因素;基于所述参考对象,确定重置时间点,所述重置时间点为在保证语音识别性能的情况下,初始化所述语音检测模型中的历史积累的时刻;在所述重置时间点到达时,重置所述语音检测模型。
-
公开(公告)号:CN110517677A
公开(公告)日:2019-11-29
申请号:CN201910797459.1
申请日:2019-08-27
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G10L15/22 , G10L21/0216
摘要: 本申请公开了一种基于人工智能的语音处理系统,包括:声音采集模块,用于采集声音信号;空间谱分析模块,用于分析所述声音信号得到空间谱;语音标注模块,用于根据所述空间谱标注所述声音信号中是否包含给定方位角附近的语音信号得到标注结果,向与其对应的自适应波束形成器发送所述标注结果;所述自适应波束形成器,用于根据所述标注结果更新自身系数,对所述声音信号进行增强得到增强语音信号,所述增强语音信号用于语音识别。通过新增空间谱分析模块和语音标注模块,实现对声音信号中是否包含指定方向的语音进行标注,为波束形成器进行语音增强提供参考信息,以提高语音识别性能。本申请还公开了对应的方法、设备、语音识别系统及介质。
-
公开(公告)号:CN110120217B
公开(公告)日:2023-11-24
申请号:CN201910390481.4
申请日:2019-05-10
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G10L15/05 , G10L15/22 , G10L21/0208 , G10L21/0216 , G10L21/0272
摘要: 本发明实施例公开了一种音频数据处理方法及装置,该音频数据处理方法包括:获取拾音信号,根据第一驾驶方向参数信息,确定拾音信号所包含的第一预处理信号,根据第二驾驶方向参数信息,确定拾音信号所包含的第二预处理信号;根据第一预处理信号与第二预处理信号对应的信噪比,确定分离参数信息,根据分离参数信息,确定第一预处理信号对应的第一分离信号,以及第二预处理信号对应的第二分离信号;获取第一分离信号与第二分离信号所包含的异常信号,将异常信号进行消除,得到第一驾驶方向对应的第一音频信号,以及第二驾驶方向对应的第二音频信号。采用本发明实施例,可以提高语音识别的准确率。
-
公开(公告)号:CN110517680B
公开(公告)日:2023-02-03
申请号:CN201910809694.6
申请日:2018-11-15
申请人: 腾讯科技(深圳)有限公司
摘要: 本发明实施例提供了一种人工智能的数据检测方法及装置、存储介质,该方法包括:针对至少一个方向支路的语音检测时,采用语音检测模型对至少一个方向支路中的待检测音频数据进行语音识别,得到每一个方向支路的当前检测结果;基于每一个方向支路的当前检测结果对自身方向支路对应的语音检测模型进行重置操作,得到重置时间点;在重置时间点到达时,重置每一个方向支路的语音检测模型;根据每一个方向支路的重置后语音检测模型对至少一个方向支路分别进行语音识别。
-
公开(公告)号:CN110164423B
公开(公告)日:2023-01-20
申请号:CN201810887965.5
申请日:2018-08-06
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请公开了一种方位角估计的方法,包括:获取多通路采样信号并缓存所述多通路采样信号;对所述多通路采样信号中每路采样信号进行唤醒词检测,并确定每路采样信号的唤醒词检测得分;若根据所述每路采样信号的唤醒词检测得分确定存在所述唤醒词,则对缓存的所述多通路采样信号进行空间谱估计,以得到空间谱估计结果,所述唤醒词包含于目标语音;根据所述空间谱估计结果和最高的唤醒词检测得分,确定所述目标语音的方位角。本申请技术方案由于采用唤醒词辅助估计目标语音的方位角,从而提高了语音交互过程中方位角估计的准确性。
-
公开(公告)号:CN110351633B
公开(公告)日:2022-05-24
申请号:CN201910741189.2
申请日:2018-12-27
申请人: 腾讯科技(深圳)有限公司
IPC分类号: H04R3/00
摘要: 本申请是关于一种声音采集设备,涉及声学处理技术领域。声音采集设备包括声音信号处理芯片及声音采集组件阵列,阵列包括两个第一声音采集组件、两个第二声音采集组件以及两个第三声音采集组件;两个第二声音采集组件位于两个该第一声音采集组件之间的连线一侧,且两个第三声音采集组件位于该连线的另一侧;两个第二声音采集组件以该连线的中垂线对称,且两个第三声音采集组件以该中垂线对称;两个第一声音采集组件之间的距离大于两个第二声音采集组件之间的距离,且两个第一声音采集组件之间的距离大于两个第三声音采集组件之间的距离。上述组件适应狭长外观设计,同时提高声音信号处理效率。
-
公开(公告)号:CN110415698B
公开(公告)日:2022-05-13
申请号:CN201910809813.8
申请日:2018-11-15
申请人: 腾讯科技(深圳)有限公司
摘要: 本发明实施例提供了一种人工智能的数据检测方法及装置、存储介质,该方法包括:获取待检测音频数据;当检测到的检测通路的主检测通路和备份检测通路时,通过重置和启动控制器控制主检测通路的重置,以及控制备份检测通路的重置和启动,得到每个检测通路的重置后语音检测模型;利用重置后语音检测模型对主检测通路和备份检测通路的待检测音频数据进行识别,得到主检测通路的主检测结果和备份检测通路备份检测结果;将主检测结果和备份检测结果进行综合处理后,输出总检测结果。
-
公开(公告)号:CN110277093B
公开(公告)日:2021-10-26
申请号:CN201910696493.X
申请日:2019-07-30
申请人: 腾讯科技(深圳)有限公司
摘要: 本发明公开了一种音频信号的检测方法及装置。其中,该方法包括:获取采集到的目标音频信号;从目标音频信号中获取多个目标方向的波束信号;根据多个目标方向的波束信号和目标音频信号生成目标音频信号对应的音频特征;对音频特征进行唤醒词检测;在从音频特征中检测到目标唤醒词的情况下,启动目标设备,其中,目标设备是在接收到目标唤醒词时启动的设备。该方法涉及人工智能的自然语言处理等技术。本发明解决了智能设备的唤醒率较低的技术问题。
-
公开(公告)号:CN110277093A
公开(公告)日:2019-09-24
申请号:CN201910696493.X
申请日:2019-07-30
申请人: 腾讯科技(深圳)有限公司
摘要: 本发明公开了一种音频信号的检测方法及装置。其中,该方法包括:获取采集到的目标音频信号;从目标音频信号中获取多个目标方向的波束信号;根据多个目标方向的波束信号和目标音频信号生成目标音频信号对应的音频特征;对音频特征进行唤醒词检测;在从音频特征中检测到目标唤醒词的情况下,启动目标设备,其中,目标设备是在接收到目标唤醒词时启动的设备。该方法涉及人工智能的自然语言处理等技术。本发明解决了智能设备的唤醒率较低的技术问题。
-
-
-
-
-
-
-
-
-