-
公开(公告)号:CN110364162B
公开(公告)日:2022-03-15
申请号:CN201910810103.7
申请日:2018-11-15
申请人: 腾讯科技(深圳)有限公司
摘要: 本发明实施例提供了一种人工智能的重置方法及装置、存储介质,该方法包括:获取待检测音频数据;将待检测音频数据进行音频特征提取,将音频特征输入至语音检测模型中,输出了当前检测结果;将当前检测结果与预设重置门限进行对比,当当前检测结果满足预设重置门限时,表征进行语音检测模型的重置,获取当前时间点,确定当前时间点为重置时间点其中,预设重置门限大于等于预设唤醒门限;在重置时间点到达时,重置语音检测模型。
-
公开(公告)号:CN110517679B
公开(公告)日:2022-03-08
申请号:CN201910809323.8
申请日:2018-11-15
申请人: 腾讯科技(深圳)有限公司
摘要: 本发明实施例提供了一种人工智能的音频数据处理方法及装置、存储介质,该方法包括:获取语音检测模型,所述语音检测模型为具有历史积累特性的至少一个检测通路的音频数据和语音识别结果的对应关系;当检测到的至少一个检测通路的数量为一个时,基于当前检测结果进行重置语音检测模型的重置时间点;当检测到的至少一个检测通路的数量为大于一个时,基于当前时间点进行重置语音检测模型的重置时间点;其中,所述重置时间点为在保证语音识别性能的情况下,初始化所述语音检测模型中的历史积累的时刻;在所述重置时间点到达时,重置所述语音检测模型。
-
公开(公告)号:CN109660918B
公开(公告)日:2021-11-09
申请号:CN201811610594.2
申请日:2018-12-27
申请人: 腾讯科技(深圳)有限公司
IPC分类号: H04R3/00
摘要: 本申请是关于一种声音采集组件阵列,涉及声学处理技术领域。该声音采集组件阵列包括:两个第一声音采集组件、两个第二声音采集组件以及两个第三声音采集组件;两个第二声音采集组件位于两个该第一声音采集组件之间的连线一侧,且两个第三声音采集组件位于该连线的另一侧;两个第二声音采集组件以该连线的中垂线对称,且两个第三声音采集组件以该中垂线对称;两个第一声音采集组件之间的距离大于两个第二声音采集组件之间的距离,且两个第一声音采集组件之间的距离大于两个第三声音采集组件之间的距离;两个第二声音采集组件之间的距离与两个第三声音采集组件之间的距离不同。上述组件适应狭长外观设计,同时提高声音信号处理效率。
-
公开(公告)号:CN110503969B
公开(公告)日:2021-10-26
申请号:CN201910745472.2
申请日:2018-11-23
申请人: 腾讯科技(深圳)有限公司
发明人: 高毅
IPC分类号: G10L21/02 , G10L21/0208 , G10L21/0216 , G10L15/02 , G10L15/06 , G10L15/08 , G10L15/20 , G10L25/18 , G10L15/22
摘要: 本发明实施例公开一种音频数据处理方法、装置及存储介质,其中,该方法应用于人工智能领域,包括:获取环境空间中的多路音频数据,并基于多路音频数据得到语音数据集合,并在多个增强方向上分别生成语音数据集合对应的增强语音信息;将增强语音信息中的语音隐藏特征与目标匹配词进行匹配,并将与目标匹配词具有最高匹配度的增强语音信息对应的增强方向,确定为目标音频方向;获取增强语音信息中的语音频谱特征,并在语音频谱特征中获取目标音频方向上的语音频谱特征;基于目标匹配词对目标音频方向上的语音隐藏特征和语音频谱特征进行语音验证,得到目标验证结果。采用本发明,可以在提高语音控制的准确度的同时,有效地降低误识别率。
-
公开(公告)号:CN113380260A
公开(公告)日:2021-09-10
申请号:CN202010115396.X
申请日:2020-02-25
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G10L19/018 , H04L12/18 , H04L29/06
摘要: 本申请涉及一种音频处理方法和装置,所述方法包括:通过当前登录的用户标识参与目标在线会议;获取在所述目标在线会议中产生的会议音频;获取与所述用户标识相对应的音频水印;所述音频水印根据所述用户标识所标识的会议成员的身份数据生成;将所述音频水印添加至所述会议音频中,得到所述目标在线会议的目标音频;所述目标音频中添加的音频水印用于在所述目标音频被泄露时,定位生成所述目标音频的会议成员。本申请提供的方案能够提升会议内容的安全性。
-
公开(公告)号:CN110021289B
公开(公告)日:2021-08-31
申请号:CN201910244164.1
申请日:2019-03-28
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G10K11/178 , G10L21/0208
摘要: 本发明实施例公开了一种声音信号处理方法、装置及存储介质;该方法采集声音信号,声音信号包括当前输出的多个不同声道的声音输出信号,以及当前输入的声音输入信号,基于每个声道对应的声音输出信号、滤波器参数,估计每个声道对应的回声信号,基于回声信号,对声音输入信号进行回声消除处理,得到残差信号,从声音输出信号的多个不同声道中确定待处理的目标声道,基于残差信号对目标声道对应的当前滤波器参数进行调整,并返回执行采集声音信号的步骤,直至未采集到声音输出信号。该方案可以有效的进行回声消除。
-
公开(公告)号:CN110517680A
公开(公告)日:2019-11-29
申请号:CN201910809694.6
申请日:2018-11-15
申请人: 腾讯科技(深圳)有限公司
摘要: 本发明实施例提供了一种人工智能的数据检测方法及装置、存储介质,该方法包括:针对至少一个方向支路的语音检测时,采用语音检测模型对至少一个方向支路中的待检测音频数据进行语音识别,得到每一个方向支路的当前检测结果;基于每一个方向支路的当前检测结果对自身方向支路对应的语音检测模型进行重置操作,得到重置时间点;在重置时间点到达时,重置每一个方向支路的语音检测模型;根据每一个方向支路的重置后语音检测模型对至少一个方向支路分别进行语音识别。
-
公开(公告)号:CN110491403A
公开(公告)日:2019-11-22
申请号:CN201910741369.0
申请日:2018-11-30
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G10L21/0208 , G10L21/0216 , G10L21/0224 , G10L21/0232 , G10L25/51 , G01S3/802
摘要: 本申请揭示了一种音频信号的处理方法、装置、介质和音频交互设备。所述方法包括:获取音频信号;在音频交互设备中获取回声参考信号,通过所述回声参考信号对麦克风采集的所述音频信号进行线性回声消除;在所述音频信号消回声之后进行时频分析,获得消回声后音频信号的时频域表达。本申请实施例的技术方案可以有效消除音频信号中的回声信号,以实现对音频信号的预处理。
-
公开(公告)号:CN110364166A
公开(公告)日:2019-10-22
申请号:CN201910744527.8
申请日:2018-06-28
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G10L15/26 , G10L21/0216
摘要: 本申请涉及一种实现语音信号识别的电子设备,包括:用于采集音频信号的麦克风阵列;与麦克风阵列连接的多个处理器;各处理器配对配置有波束形成器和语音识别模块,其中,各波束形成器,用于将音频信号在设定的多个不同目标方向分别进行波束成形处理,得到对应的多路波束信号;各语音识别模块,用于分别对配对的各波束形成器输出的波束信号进行语音识别,得到各路波束信号的语音识别结果;其中一个处理器配置有处理模块,用于根据各路波束信号的语音识别结果,确定音频信号的语音识别结果。该方法通过在不同目标方向进行波束成形处理,那么至少一个目标方向与语音信号产生方向接近,能够提高智能语音识别的准确度。
-
公开(公告)号:CN110364162A
公开(公告)日:2019-10-22
申请号:CN201910810103.7
申请日:2018-11-15
申请人: 腾讯科技(深圳)有限公司
摘要: 本发明实施例提供了一种人工智能的重置方法及装置、存储介质,该方法包括:获取待检测音频数据;将待检测音频数据进行音频特征提取,将音频特征输入至语音检测模型中,输出了当前检测结果;将当前检测结果与预设重置门限进行对比,当当前检测结果满足预设重置门限时,表征进行语音检测模型的重置,获取当前时间点,确定当前时间点为重置时间点其中,预设重置门限大于等于预设唤醒门限;在重置时间点到达时,重置语音检测模型。
-
-
-
-
-
-
-
-
-