婴儿啼哭检测方法、检测装置、电子设备及存储介质

    公开(公告)号:CN116453550A

    公开(公告)日:2023-07-18

    申请号:CN202310183220.1

    申请日:2023-03-01

    Abstract: 本申请公开了一种婴儿啼哭检测方法、检测装置、电子设备及存储介质,婴儿啼哭检测方法,包括:获取当前环境音频数据;输入当前环境音频数据至目标婴儿啼哭检测模型,使得目标婴儿啼哭检测模型根据当前环境音频数据输出对应的婴儿啼哭检测结果,婴儿啼哭检测结果包括婴儿啼哭结果以及婴儿未啼哭结果,目标婴儿啼哭检测模型基于时延神经网络和残差网络得到;接收目标婴儿啼哭检测模型返回的婴儿啼哭检测结果。本方法实现了根据时延神经网络以及残差网络构建的目标婴儿啼哭检测模型,对婴儿啼哭进行检测,目标婴儿啼哭检测模型的表达能力强,提高了对婴儿啼哭进行检测的检测准确率。

    语音降噪方法、处理终端及存储介质

    公开(公告)号:CN117594053A

    公开(公告)日:2024-02-23

    申请号:CN202311477764.5

    申请日:2023-11-07

    Abstract: 本发明提供一种语音降噪方法、处理终端及存储介质。该方法包括:对当前帧语音数据进行傅里叶变换,得到傅里叶变换频谱;将傅里叶变换频谱输入神经网络模型进行噪声估计得到噪声谱,并根据噪声谱确定各频点的增益系数;根据各个频点的增益系数乘以傅里叶变换频谱,得到降噪后的频谱;对降噪后的频谱进行反傅里叶变换得到当前帧降噪后的语音数据。本发明采用神经网络计算噪声谱,进而根据噪声谱对语音数据进行降噪,并不直接采用神经网络模型降噪,降低了计算量,同时对平稳噪声和非平稳噪声均可进行更准确的估计,准确率高。

    婴儿啼哭原因的辨别方法、装置、终端及存储介质

    公开(公告)号:CN116741207A

    公开(公告)日:2023-09-12

    申请号:CN202310759823.1

    申请日:2023-06-26

    Abstract: 本发明提供了一种婴儿啼哭原因的辨别方法、装置、终端及存储介质,该方法包括:获取婴儿啼哭音频信号;提取所述婴儿啼哭音频信号的时域特征,并基于所述时域特征确定所述婴儿啼哭音频信号的哭声持续时间和哭声中断次数;对所述婴儿啼哭音频信号进行傅里叶变换,得到所述婴儿啼哭音频信号的频谱,并从所述频谱中提取频谱特征,所述频谱特征包括共振峰信息和能量熵信息;基于所述哭声持续时间、哭声中断次数和所述频谱特征,确定所述婴儿啼哭音频信号对应的婴儿啼哭原因。本申请通过仔细研究婴儿啼哭的声学特征,找出具有高区分度的的特征以识别婴儿啼哭原因,从而提高婴儿啼哭原因的识别准确性。

    语音增益控制方法、装置、终端及存储介质

    公开(公告)号:CN117912462A

    公开(公告)日:2024-04-19

    申请号:CN202311622161.X

    申请日:2023-11-29

    Abstract: 本发明提供一种语音增益控制方法、装置、终端及存储介质。该方法包括:对当前帧原始语音信号进行傅里叶变换,得到当前帧原始语音信号的频谱,并确定所述频谱中各个频点的幅度值;计算所述频谱中各个频点的信噪比;根据各个频点的信噪比和幅度值,确定对应频点的增益系数;基于各个频点的增益系数对相应频点的幅度值进行增强,得到目标语音信号。上述方法能够对原始语音信号进行分帧处理,并在频域对当前帧原始语音信号不同频点的幅度值基于其信噪比和幅度值确定适应的增益值,从而在增益控制过程中降低噪声的干扰,不仅能改善语音增益控制效果,还能提高响应速度。

    一种声源定位方法、装置、设备、存储介质及程序产品

    公开(公告)号:CN119247273A

    公开(公告)日:2025-01-03

    申请号:CN202411295319.1

    申请日:2024-09-14

    Abstract: 本申请公开了一种声源定位方法、装置、设备、存储介质及程序产品,其中,所述方法包括:获取M个通道数据,所述M个通道数据对应于麦克风阵列采集的M个通道的音频信号,M为正整数;对所述M个通道数据进行分帧加窗处理,得到N帧时域信号,N为正整数;基于所述N帧时域信号,确定时域协方差向量;通过声源定位模型基于所述时域协方差向量确定声源的方位。

Patent Agency Ranking