一种音频数据处理方法及装置、存储介质

    公开(公告)号:CN110164431A

    公开(公告)日:2019-08-23

    申请号:CN201811361659.4

    申请日:2018-11-15

    IPC分类号: G10L15/22 G10L15/06 G10L15/26

    摘要: 本发明实施例提供了一种音频数据处理方法及装置、存储介质,该方法包括:获取语音检测模型,所述语音检测模型为具有历史积累特性的至少一个检测通路的音频数据和语音识别结果的对应关系;基于检测到的所述至少一个检测通路的数量,确定参考对象;所述参考对象为进行重置操作判断的因素;基于所述参考对象,确定重置时间点,所述重置时间点为在保证语音识别性能的情况下,初始化所述语音检测模型中的历史积累的时刻;在所述重置时间点到达时,重置所述语音检测模型。

    声源方位角运算、定位目标音频的方法、装置和设备

    公开(公告)号:CN109597022B

    公开(公告)日:2023-02-17

    申请号:CN201811455880.6

    申请日:2018-11-30

    IPC分类号: G01S3/802

    摘要: 本发明揭示了一种声源方位角运算方法、音频交互设备定位目标音频的方法、装置和音频交互设备。所述方法包括:获取音频信号进行消回声处理;获取消回声后音频信号的时频域表达和时频点的权值;通过时频点的权值和时频域表达,获取对应于时频点的加权协方差矩阵;通过加权协方差矩阵进行空间谱的加权运算获得音频信号按照时频点加权的空间谱;由空间谱获得音频信号中目标音频直射信号对应的声源方位角。在空间谱作用下有效控制运算量,并且由于加权协方差矩阵是对应于音频信号中目标音频直射信号的相对比重的,因此有效降低干扰信号对空间谱的干扰,增强方位角运算在复杂场景下的鲁棒性,方位角的准确性得到增强,能够为音频交互准确获得方位角。

    远场拾音设备、及远场拾音设备中采集人声信号的方法

    公开(公告)号:CN110166882B

    公开(公告)日:2021-05-25

    申请号:CN201811150947.5

    申请日:2018-09-29

    发明人: 郑脊萌 于蒙 苏丹

    IPC分类号: H04R1/20 H04R3/12

    摘要: 本公开提供了一种远场拾音设备、及远场拾音设备中采集人声信号的方法。所述远场拾音系统包括分离的设备主体和麦克风拾音单元。所述麦克风拾音单元采集用户语音和所述设备主体播放的声音信号在空间传播后的回声并发送回所述设备主体处理。所述设备主体包括:播放信号源;同步信号发生器;喇叭;延迟确定单元;回声消除单元。本公开实施例能解决现有技术中麦克风信号和回声参考信号无法同步的问题,提高语音识别性能。

    一种基于多音区的语音检测方法、相关装置及存储介质

    公开(公告)号:CN111833899A

    公开(公告)日:2020-10-27

    申请号:CN202010732649.8

    申请日:2020-07-27

    摘要: 本申请公开了一种基于多音区的语音检测方法,该方法应用于人工智能领域,本申请提供的语音检测方法包括:获取N个音区内每个音区所对应的音区信息;根据每个音区所对应的音区信息,生成每个音区所对应的控制信号;采用每个音区所对应的控制信号,对每个音区所对应的语音输入信号进行处理,得到每个音区所对应的语音输出信号;根据每个音区所对应的语音输出信号,生成语音检测结果。本申请还公开了一种语音检测装置以及存储介质。本申请可基于多个音区并行处理来自不同方向的语音信号,在多声源的场景下,通过控制信号对不同方向上的语音信号进行保留或者抑制,从而能够实时分离和增强每个用户的语音,由此提升语音检测的准确度。

    信号生成的方法、基于人工智能的语音识别方法及装置

    公开(公告)号:CN110517702A

    公开(公告)日:2019-11-29

    申请号:CN201910843381.2

    申请日:2019-09-06

    摘要: 本申请公开了一信号生成的方法,该方法应用于人工智能领域,包括:当通过麦克风阵列获取目标语音帧对应的语音输入信号时,根据语音输入信号获取待估计角度对应的第一信号能量,待估计角度在入射方位角范围内;根据目标语音帧所对应的语音输入信号以及波束形成器系数,确定目标语音帧对应的第二信号能量;根据第一信号能量以及第二信号能量,确定待估计角度对应的空间特征;根据空间特征生成目标语音帧对应的目标控制信号。本申请还公开了一种基于人工智能的语音识别方法及装置。本申请能够分别确定来自各个待估计角度方向上的空间特征,基于空间特征生成相应的控制信号,提升控制信号的准确性和鲁棒性,提高前处理系统对语音信号增强的性能。

    声音采集设备
    16.
    发明公开

    公开(公告)号:CN110351633A

    公开(公告)日:2019-10-18

    申请号:CN201910741189.2

    申请日:2018-12-27

    IPC分类号: H04R3/00

    摘要: 本申请是关于一种声音采集设备,涉及声学处理技术领域。声音采集设备包括声音信号处理芯片及声音采集组件阵列,阵列包括两个第一声音采集组件、两个第二声音采集组件以及两个第三声音采集组件;两个第二声音采集组件位于两个该第一声音采集组件之间的连线一侧,且两个第三声音采集组件位于该连线的另一侧;两个第二声音采集组件以该连线的中垂线对称,且两个第三声音采集组件以该中垂线对称;两个第一声音采集组件之间的距离大于两个第二声音采集组件之间的距离,且两个第一声音采集组件之间的距离大于两个第三声音采集组件之间的距离。该设备适应狭长外观设计,且提高诸如智能语音交互等人工智能场景下的声音信号处理效率。

    语音信号识别方法和装置、计算机设备和电子设备

    公开(公告)号:CN110164446A

    公开(公告)日:2019-08-23

    申请号:CN201810689667.5

    申请日:2018-06-28

    IPC分类号: G10L15/26 G10L21/0216

    摘要: 本申请涉及一种语音信号识别方法、装置、计算机设备和电子设备,方法包括:接收麦克风阵列采集的音频信号;将音频信号在设定的多个不同目标方向分别进行波束成形处理,得到对应的多路波束信号;分别对每路波束信号进行语音识别,得到各路波束信号的语音识别结果;根据各路波束信号的语音识别结果,确定音频信号的语音识别结果。该方法无需考虑声源角度,通过在不同目标方向进行波束成形处理,那么至少一个目标方向与语音信号产生方向接近,因而至少一个在目标方向进行增强后的波束信号是清楚地,因而根据各波束信号进行语音识别,能够提高在该方向上对音频信号进行识别的准确度。

    声源方位角运算、定位目标音频的方法、装置和设备

    公开(公告)号:CN109597022A

    公开(公告)日:2019-04-09

    申请号:CN201811455880.6

    申请日:2018-11-30

    IPC分类号: G01S3/802

    摘要: 本发明揭示了一种声源方位角运算方法、音频交互设备定位目标音频的方法、装置和音频交互设备。所述方法包括:获取音频信号进行消回声处理;获取消回声后音频信号的时频域表达和时频点的权值;通过时频点的权值和时频域表达,获取对应于时频点的加权协方差矩阵;通过加权协方差矩阵进行空间谱的加权运算获得音频信号按照时频点加权的空间谱;由空间谱获得音频信号中目标音频直射信号对应的声源方位角。在空间谱作用下有效控制运算量,并且由于加权协方差矩阵是对应于音频信号中目标音频直射信号的相对比重的,因此有效降低干扰信号对空间谱的干扰,增强方位角运算在复杂场景下的鲁棒性,方位角的准确性得到增强,能够为音频交互准确获得方位角。

    语音增强方法、装置、智能语音设备和计算机设备

    公开(公告)号:CN108615535A

    公开(公告)日:2018-10-02

    申请号:CN201810427071.8

    申请日:2018-05-07

    摘要: 本申请提供一种语音增强方法、装置、智能语音设备和计算机设备,其中方法包括:获取待处理的语音信号;将语音信号输入语音增强模型,去除语音信号中的噪声和/或干扰语音,得到处理后的语音信号;语音增强模型,为根据混合语音信号进行训练得到的模型;混合语音信号,为在纯净唤醒词语音信号中添加噪声和/或干扰语音后得到的信号;纯净唤醒词语音信号为,噪声和干扰语音的占比小于比例阈值的唤醒词语音信号;语音增强模型能够有效去除语音信号中的噪声和干扰语音,例如与非唤醒词相关的语音,从而提高语音增强效果,对处理后的语音信号进行语音识别处理,提高唤醒词识别的准确度以及唤醒效率,提高用户的使用体验。

    实现语音信号识别的电子设备

    公开(公告)号:CN110364166B

    公开(公告)日:2022-10-28

    申请号:CN201910744527.8

    申请日:2018-06-28

    IPC分类号: G10L15/26 G10L21/0216

    摘要: 本申请涉及一种实现语音信号识别的电子设备,包括:用于采集音频信号的麦克风阵列;与麦克风阵列连接的多个处理器;各处理器配对配置有波束形成器和语音识别模块,其中,各波束形成器,用于将音频信号在设定的多个不同目标方向分别进行波束成形处理,得到对应的多路波束信号;各语音识别模块,用于分别对配对的各波束形成器输出的波束信号进行语音识别,得到各路波束信号的语音识别结果;其中一个处理器配置有处理模块,用于根据各路波束信号的语音识别结果,确定音频信号的语音识别结果。该方法通过在不同目标方向进行波束成形处理,那么至少一个目标方向与语音信号产生方向接近,能够提高智能语音识别的准确度。