一种个性化Ambisonics语音增强方法
    11.
    发明公开

    公开(公告)号:CN118212929A

    公开(公告)日:2024-06-18

    申请号:CN202410480255.6

    申请日:2024-04-22

    Inventor: 周翊 周嘉诚

    Abstract: 一种个性化Ambisonics语音增强方法,包括:获取待增强的语音数据,对待增强的语音数据提取频谱图,并对待增强的语音数据进行短时傅里叶变换;将频谱图输入到说话人编码器中,并输入到时域掩码系统的LSTM网络中;将短时傅里叶变换后的信号输入到复数特征编码器,得到实部虚部频谱图;LSTM网络对目标说话人嵌入向量和实部虚部频谱图进行处理,并输入到FCN网络中,得到增强后的目标说话者语音;将增强后的目标说话者语音与短时傅里叶变换后的信号进行乘积,并将乘积后的信号进行短时傅里叶逆变换,得到增强后的干净语音信号;本发明通过构建目标说话人编码器提取目标说话人语音高维特征,从而将干扰语音和背景噪声同时去除。

    一种骨导传感器辅助的广义旁瓣消除方法

    公开(公告)号:CN118072755A

    公开(公告)日:2024-05-24

    申请号:CN202410202770.8

    申请日:2024-02-23

    Inventor: 周翊 余冰雪

    Abstract: 本发明属于信号处理技术领域,涉及一种骨导传感器辅助的广义旁瓣消除方法,包括:分别利用骨导传感器和麦克风采集语音信号;根据骨导传感器采集的语音信号估计语音存在概率,根据语音存在概率计算语音活动检测结果;利用广义旁瓣消除器根据语音活动检测结果对麦克风采集的语音信号进行过滤,得到增强信号;本发明利用骨导语音得到准确语音活动检测结果VAD,进而利用得到的VAD控制GSC中自适应阻塞矩阵和自适应噪声消除器的系数更新,减少了期望信号失真的同时具有更好的噪声抑制效果和更强的鲁棒性;本发明采用了一种有效的迭代策略,进一步消除残留噪声,不仅能够明显地提升语音质量,而且能提升语音可懂度。

    一种语音增强网络信噪比估计器及损失优化方法

    公开(公告)号:CN116364109A

    公开(公告)日:2023-06-30

    申请号:CN202310200774.8

    申请日:2023-03-03

    Abstract: 本发明公开了一种语音增强网络信噪比估计器,包括编码器和解码器,编码器和解码器之间设置有复数运算的CNN、复数LSTM和复数的BN层,编码器包含了复Conv2D层、复BN层和实数PReLU层,LSTM层后设置有1‑D卷积模块,1‑D卷积模块由多个一维卷积层和全连接层交替串行组合,全连接层具有sigmoid函数,信噪比估计器采用了两个一维卷积层和具有sigmoid函数的全连接层串行组合,输入是经过复LSTM计算后的带噪语音信号实部和虚部的拼接,输出为根据公式计算出的帧级先验信噪比,以保持良好的语音质。

    一种冲击噪声下的自适应联合滤波方法

    公开(公告)号:CN106253878B

    公开(公告)日:2018-10-12

    申请号:CN201610569440.8

    申请日:2016-07-19

    Abstract: 本发明请求保护一种冲击噪声下的自适应联合滤波方法,研究发现冲击噪声不仅具有在有限的时间内呈现较大的幅度,在其他时间内的幅度值则很小的近似稀疏特性,而且表现为组稀疏特性,即信号在时间域中其大部分样本值为零的同时,非零样本值成组/簇出现。通过利用冲击噪声的这个特点并结合信号自身特点重新构造目标函数,设计出信号/噪声的联合估计算法来提高信号恢复质量。经过对算法进行理论分析和计算机仿真分析表明,提出的算法性能更优越,在参数估计、语音信号处理等领域中有着很好的应用前景。

    一种冲击噪声下的自适应联合滤波方法

    公开(公告)号:CN106253878A

    公开(公告)日:2016-12-21

    申请号:CN201610569440.8

    申请日:2016-07-19

    CPC classification number: H03H21/0043 H03H21/0012

    Abstract: 本发明请求保护一种冲击噪声下的自适应联合滤波方法,研究发现冲击噪声不仅具有在有限的时间内呈现较大的幅度,在其他时间内的幅度值则很小的近似稀疏特性,而且表现为组稀疏特性,即信号在时间域中其大部分样本值为零的同时,非零样本值成组/簇出现。通过利用冲击噪声的这个特点并结合信号自身特点重新构造目标函数,设计出信号/噪声的联合估计算法来提高信号恢复质量。经过对算法进行理论分析和计算机仿真分析表明,提出的算法性能更优越,在参数估计、语音信号处理等领域中有着很好的应用前景。

    一种使用QR-RLS算法对多通道语音信号去混响方法

    公开(公告)号:CN108154885A

    公开(公告)日:2018-06-12

    申请号:CN201711353578.5

    申请日:2017-12-15

    Abstract: 本发明涉及一种使用QR-RLS算法对多通道语音信号去混响方法,属于信号处理技术领域。该方法将采集得到的带混响语音信号进行短时傅里叶变换,并在频域对输入信号进行延迟处理,通过混响时间T60计算混响语音信号的衰减常数Δ,从而估计出晚期混响信号和期望信号的功率谱密度;然后根据得到的期望信号功率谱密度的估计值计算期望信号2范数的加权系数;最后将延迟信号和带混响语音信号作为QR-RLS算法的输入数据,对其进行迭代更新,最后输出预测滤波器系数。本发明有效避免了当输入信号不具有一致性激励性时,自相关矩阵及其对应的求逆问题是病态的问题;使在病态环境下可以很容易的随时检查变换信息矩阵的正定性,从而有效提升了去混响系统中自适应模块的稳定性。

    一种用于麦克风阵列广义旁瓣消除器的高效自适应算法

    公开(公告)号:CN108039179A

    公开(公告)日:2018-05-15

    申请号:CN201711330002.7

    申请日:2017-12-13

    Abstract: 本发明涉及一种用于麦克风阵列广义旁瓣消除器的高效自适应算法,属于信号处理技术领域。该方法包括步骤S1:将GPAPA计算权值比例因子的方法引入MPAPA算法,得到MGPAPA算法;S2:将MGPAPA算法引入GSC的ANC模块。本发明采用的MGPAPA算法相比传统GSC中ANC模块采用的NLMS算法具有更快的收敛速度和更低的稳态误差;相比LMS/Newton算法具有更少的计算量。同时整合了GPAPA算法计算权值比例因子的方法,相比MPAPA算法,减少了对脉冲响应疏密程度的敏感度。该算法通过改善ANC的自适应滤波性能,提升了GSC的降噪效果。

    一种基于声学频谱-时域信息融合的应急车辆检测方法

    公开(公告)号:CN119724230A

    公开(公告)日:2025-03-28

    申请号:CN202411910392.5

    申请日:2024-12-24

    Inventor: 周翊 周浩 赵宇

    Abstract: 本发明属于车载声学信号处理与识别领域,具体涉及一种基于声学频谱‑时域信息融合的应急车辆检测方法,包括:通过车载麦克风设备从环境中采集音频信号,并将其分别用频域表示和时域表示;引入坐标注意力网络对时域表示和频域表示中的特征进行融合计算,得到注意力融合后的特征;将注意力融合后的特征输入轻量级检测神经网络模型,计算当前信号中是否存在警笛声。本发明通过融合时域与频域信息,并结合坐标注意力机制,能够在高速行驶或其他噪声干扰较大的场景中保持较高的识别精度;尤其在发动机噪声、风噪声以及交通流量等背景噪声影响较大的情况下,仍能准确检测到应急车辆的警笛声,增强了系统的鲁棒性。

    一种音视频融合多说话人检测设备

    公开(公告)号:CN116233687A

    公开(公告)日:2023-06-06

    申请号:CN202310206261.8

    申请日:2023-03-03

    Abstract: 本发明公开了一种音视频融合多说话人检测设备,包括外球壳、内球套、架台、麦克风阵列环和控制主机,外球壳由架台架设在指定位置,外球壳壳体安装有摄像头,内球套同心设置在外球壳内部,内球套内部设置有控制主机,麦克风阵列环设置在外球壳和内球套之间,麦克风阵列环包括至少两个交叉环圈,每个交叉环圈外侧均匀设置有多个微型麦克风,每个交叉环圈外侧还对称安装有两驱动件,驱动件包括固定座、控制器、X轴驱动器、Y轴驱动器和万向滚动球,固定座内部具有球形槽,万向滚动球设置在球形槽内,万向滚动球从球形槽部分探出且与外球壳内壁紧贴,麦克风阵列环可以在多说话人的语音场景中灵活调整,检测设备的语音识别和声源定位准确率大大提升。

Patent Agency Ranking