-
公开(公告)号:CN113178204B
公开(公告)日:2023-05-30
申请号:CN202110467314.2
申请日:2021-04-28
申请人: 云知声智能科技股份有限公司 , 厦门云知芯智能科技有限公司
IPC分类号: G10L21/0208 , G10L21/0216 , G10L25/30 , G06N3/08
摘要: 本发明涉及一种所述单通道语音的处理方法、装置及存储介质,其中,所述单通道语音的处理方法包括:采集带有噪声的语音信号;根据短时离散余弦变换STDCT提取所述带有噪声的语音信号的第一特征;输入所述第一特征至训练模型中以得到目标模型;获取待处理语音信号,并提取所述待处理语音信号的第二特征;输入所述第二特征至所述目标模型中以得到降噪后的目标语音信号。本发明适用于计算机领域,用于通过上述单通道语音的处理方法,降低计算量,进而减少功耗,并且提升降噪效果。
-
公开(公告)号:CN111429931B
公开(公告)日:2023-04-18
申请号:CN202010224879.3
申请日:2020-03-26
申请人: 云知声智能科技股份有限公司 , 厦门云知芯智能科技有限公司
IPC分类号: G10L21/0208 , G10L21/0216 , G10L21/0264 , G10L21/0272 , G10L21/02
摘要: 本发明提供了一种基于数据增强的降噪模型压缩方法及装置,其中方法包括:获取预设的初始Teacher模型;获取带噪的训练语音,以及获取所述带噪的训练语音对应的纯净语音;基于所述带噪的训练语音和所述纯净语音,对所述初始Teacher模型进行训练,待所述初始Teacher模型训练收敛后作为最终Teacher模型;获取预设的初始Student模型;获取实际采集的带噪实际语音;基于所述带噪的训练语音、最终Teacher模型和所述带噪实际语音对所述初始Student模型进行训练,待所述初始Student模型训练收敛后作为最终Student模型。本发明在保证降噪性能几乎不变的前提下,尽可能压缩模型的参数量,从而使降噪模型在压缩模型的同时,还能保证在实际场景运用中降噪性能不变。
-
公开(公告)号:CN112750447B
公开(公告)日:2023-01-24
申请号:CN202011504399.9
申请日:2020-12-17
申请人: 云知声智能科技股份有限公司 , 厦门云知芯智能科技有限公司
IPC分类号: G10L21/0232 , G10L21/0264 , G10L21/0216
摘要: 本发明涉及一种去除风噪的方法,一方面使用帧级通道能量赛选,选取各通道受噪声干扰小的信号,避免波束形成造成的折衷;另一方面通过使用PR修正低频带噪声分量,更准确的去除噪声干扰。
-
公开(公告)号:CN111954121B
公开(公告)日:2022-06-17
申请号:CN202010850399.8
申请日:2020-08-21
申请人: 云知声智能科技股份有限公司 , 厦门云知芯智能科技有限公司
摘要: 本发明提供了一种麦克风阵列定向拾音方法及系统,所述方法执行以下步骤:步骤1:布置由若干麦克风组成的呈一字型分布的麦克风阵列,所述一字型分布的麦克风阵列包括位于中间的小间距均匀阵列和位于两侧的大间距非均匀阵列;步骤2:根据所述一字型分布的麦克风阵列,得到初步增强信号;步骤3:根据所述小间距均匀阵列,得到噪声估计信号;步骤4:基于所述初步增强信号和所述噪声估计信号,采用自适应滤波方法,得到目标信号。根据本发明的方法,通过较宽的非均匀阵列设计更优的超指向波束形成,同时利用差分波束形成技术有效获取噪声信息,在超指向波束形成的基础上结合了自适应滤波技术,可以更加有效地抑制噪声。
-
公开(公告)号:CN111596261B
公开(公告)日:2022-06-14
申请号:CN202010256529.5
申请日:2020-04-02
申请人: 云知声智能科技股份有限公司 , 厦门云知芯智能科技有限公司
IPC分类号: G01S5/18
摘要: 本发明公开了一种声源定位方法及装置,所述方法包括:获取待估计的多通道语音;获取目标降噪模型及目标DOA估计模型;基于所述目标降噪模型及目标DOA估计模型,对所述待估计的多通道语音进行声源定位。通过本发明的技术方案,能够准确的进行声源定位。
-
公开(公告)号:CN111192589A
公开(公告)日:2020-05-22
申请号:CN202010047774.5
申请日:2020-01-16
申请人: 云知声智能科技股份有限公司 , 厦门云知芯智能科技有限公司
摘要: 本发明是关于语音唤醒方法及装置。该方法包括:确定若干个智能设备中各智能设备所接收到的唤醒词的唤醒语音;获取所述各智能设备获得的噪音数据;根据所述各智能设备接收到的唤醒语音和所述各智能设备获得的噪音数据,从所述各智能设备中选择目标被唤醒设备;通过所述目标被唤醒设备响应所述唤醒语音。通过本发明的技术方案,可同时结合智能设备的唤醒语音以及噪音数据,提高被唤醒设备的确定准确率,进而提高唤醒准确率,避免误将多个智能设备中的其他智能设备作为真正需要被唤醒的设备进行唤醒。
-
公开(公告)号:CN111402883B
公开(公告)日:2023-05-26
申请号:CN202010245803.9
申请日:2020-03-31
申请人: 云知声智能科技股份有限公司 , 厦门云知芯智能科技有限公司
IPC分类号: G10L15/22 , G10L15/20 , G10L25/51 , G10L21/0216
摘要: 本发明提出了一种复杂环境下分布式语音交互系统中就近响应方法和系统,所述就近响应系统包括信号采集模块、信号输入模块、分布式引擎和响应信号传输模块;所述方法包括步骤1、采集多个可能被唤醒的智能设备的唤醒词段数据以及每个设备前t1段时间内的噪声数据;步骤2、对每个智能设备的唤醒词数据进行盲源分离,分离出噪声干扰分量和唤醒词分量;步骤3、计算唤醒词前一段时间内唤醒词数据中噪声干扰能量和唤醒词能量,并确定唤醒词数据;步骤4、利用唤醒词分量计算各个智能设备唤醒词数据中,唤醒词分量在唤醒时间段内的能量,步骤5、在各个智能设备的唤醒词能量中,选择能量最大的设备作为最近设备进行响应。
-
公开(公告)号:CN111599375B
公开(公告)日:2023-03-21
申请号:CN202010339154.9
申请日:2020-04-26
申请人: 云知声智能科技股份有限公司 , 厦门云知芯智能科技有限公司
发明人: 关海欣
IPC分类号: G10L21/0216 , G10L21/0232 , G10L21/0208 , G10L15/22 , G10L15/20
摘要: 本发明提供了一种语音交互中多路语音的白化方法及其装置,包括:将输入多路语音数据转换到频域,获取语音频域数据;将所述语音频域数据进行缓存操作,当缓存的语音频域数据对应的时长达到T1时,使用所缓存的T1时长对应的语音频域数据计算各频带协方差矩阵,并求解所述各频带协方差矩阵的逆矩阵;继续对新获得的语音频域数据进行缓存操作,当缓存的语音频域数据对应的时长达到T2时,根据各频带协方差矩阵的逆矩阵计算白化矩阵;重复迭代执行上述步骤,当检测到唤醒状态时,使用最后一次迭代获得的白化矩阵处理剩余的白化数据。
-
公开(公告)号:CN113050035B
公开(公告)日:2022-11-25
申请号:CN202110268229.3
申请日:2021-03-12
申请人: 云知声智能科技股份有限公司 , 厦门云知芯智能科技有限公司
摘要: 本发明涉及一种二维定向拾音方法,包括:获取麦克风阵列接收到的时域的目标信号;对时域的目标信号进行傅里叶变换,得到时频域的目标信号;通过二维DOA估计,得到每帧的时频域的目标信号中的俯仰角和方位角;通过超指向空间波束形成权值,将每帧的目标信号在频域进行加权求和,得到初步增强的目标方位语音信号;将麦克风阵列中的相邻通道的时频域的目标信号通过延迟求和空间波束形成权值在频域进行加权相减,得到多通道噪声信号,并进行滤波后得到目标方向语音信号的时频域形式;当俯仰角偏差大于角度偏差阈值,或者方位角偏差大于方位角的角度偏差阈值,更新滤波器权值;将目标方向语音信号的时频域形式进行短时傅里叶逆变换,得到最终目标信号。
-
公开(公告)号:CN113192528A
公开(公告)日:2021-07-30
申请号:CN202110470353.8
申请日:2021-04-28
申请人: 云知声智能科技股份有限公司 , 厦门云知芯智能科技有限公司
IPC分类号: G10L21/0216 , G10L25/30
摘要: 本发明提供一种单通道增强语音的处理方法,适用于语音增强技术领域,改方法包括:获取带有噪声的语音信号,并对所述带有噪声的语音信号进行分帧处理;根据短时离散余弦变换STDCT对分帧后的带有噪声的语音信号进行提取,得到第一特征;输入所述第一特征至训练模型中以得到目标模型,所述训练模型包括卷积神经网络CNN、长短时记忆网络LSTM和深度神经网络DNN;获取待处理语音信号,并对所述待处理语音信号进行分帧处理;根据短时离散余弦变换STDCT对分帧后的待处理语音信号进行提取,得到第二特征;输入所述第二特征至所述目标模型中以得到增强后的目标语音信号。通过上述方法能够降低噪音,得到增强后的目标语音信号。
-
-
-
-
-
-
-
-
-