一种基于盲源分离的小波域数字音频多目的水印方法

    公开(公告)号:CN100596061C

    公开(公告)日:2010-03-24

    申请号:CN200610200026.6

    申请日:2006-01-12

    Abstract: 本发明属于多媒体信息安全技术领域,涉及到鲁棒水印和脆弱水印集成的方法,特别涉及鲁棒水印和脆弱水印的生成,水印的嵌入、提取和篡改检测方法。其特征是:借助于盲源分离的瞬时混合模型,信息量较大的鲁棒水印和脆弱水印可以按照任意顺序嵌入到原始音频信号中;对篡改可以进行精确定位,并且能大致反映出用于替换原始音频数据的信号的时域波形;完全公开多目的水印的嵌入、提取和篡改检测算法;水印的安全性依靠密钥信息来保证。本发明的效果和益处是,采用在音频产品中同时嵌入鲁棒水印和脆弱水印的方法,实现版权保护和篡改定位的目的。由于鲁棒水印和脆弱水印嵌入时可以按照任意顺序进行,不受嵌入次序的约束,不需要保密嵌入和提取算法,因而降低了算法的难度。

    一种基于循环生成对抗网络的骨导语音增强方法

    公开(公告)号:CN116825119A

    公开(公告)日:2023-09-29

    申请号:CN202310516882.6

    申请日:2023-05-09

    Inventor: 陈喆 殷福亮 王伟

    Abstract: 本发明公开了一种基于循环生成对抗网络的骨导语音增强方法,具体包括:在训练阶段提取骨导语音和相应气导语音的梅尔倒谱系数送入构建好的循环生成对抗网络进行训练,保存训练好的循环生成对抗网络中生成器的网络参数。在应用阶段将待增强的的骨导语音信号利用WORLD声码器提取基频,梅尔倒谱系数和非周期性参数等三种特征,利用训练阶段完成后保存的生成器网络参数构建特征映射模型,将其中的梅尔倒谱系数输入训练好的神经网络模型进行映射,将映射后的梅尔倒谱系数与骨导语音的基频和非周期性参数特征经WORLD声码器的语音合成功能获得增强后的骨导语音。

    一种基于头相关脉冲响应的三维音频生成装置

    公开(公告)号:CN107820158B

    公开(公告)日:2020-09-29

    申请号:CN201710551437.8

    申请日:2017-07-07

    Abstract: 本发明公开了一种基于头相关脉冲响应的三维音频生成方法,包括如下步骤:获得被测的人体生理特征参数,与头相关脉冲响应HRIR进行相关性分析;保留相关性超过阈值系数的人体生理特征参数;通过在数据库中寻找具有最小偏差之和的个体,得到当前被测人体的个性化HRIR,然后采用拉普拉斯特征映射降维(LEM)算法对HRIR进行插值;采用基于镜像模型ImageModel的前期反射混响器,对接收到的,包括在房间中的一次反射和二次反射的前期反射路径的输入音频与所述的HRIR进行卷积,恢复音频的方位信息;采用基于反馈延时网络FeedbackDelayNetwork,FDN的后期混响器得到混响音频;将所述的音频方位信息和混响音频相加,得到具有混响效果的三维音频,完成三维音频生成方法。

    一种监控音频信号的数字化装置和方法

    公开(公告)号:CN107221335B

    公开(公告)日:2020-07-14

    申请号:CN201710391613.6

    申请日:2017-05-27

    Inventor: 陈喆 殷福亮 呼德

    Abstract: 本发明公开了一种监控音频信号的数字化装置及方法,其装置包括:能够对待数字化的模拟音频信号x(t)进行自适应步长量化编码以输出1比特数字信号x1(n),并对其进行加扰以输出数字信号x2(n)的音频编码器;能够对数字信号x2(n)进行解扰以输出1比特数字信号x11(n),并对其进行采样率转换以获得N比特精度的数字信号y(n)的解码器。本发明通过采用自适应步长的Σ‑Δ编解码技术,使音频数字化装置对正常声音和大幅度的异常声音均保持较高的信噪比;能够存储高分辨率的异常声信号以便后续分析;其成本低,编码过程简单,易于电路实现,不需要附加额外A/D芯片可直接实现;在传输误码率较高的情况下仍保持高信噪比,有较好的抗误码能力等优点。

    一种高检出率的啸叫音频检测系统

    公开(公告)号:CN110782910A

    公开(公告)日:2020-02-11

    申请号:CN201911077968.3

    申请日:2019-11-06

    Abstract: 本发明公开了一种高检出率的啸叫音频检测系统,包括:预处理模块,对输入信号进行分帧、缓存和加窗处理,再对加窗后的信号进行快速傅里叶变换和语音端点检测处理;特征参数提取模块,对预处理后的每帧音频信号进行特征参数提取和缓存;啸叫检测判决模块,根据获取的Pearson系数信息对音频信号进行啸叫检测,其过程为:如果当前帧信号的Pearson系数值ρmax在检测阈值范围内,则进入短时啸叫判决过程,如果当前帧信号的Pearson系数值ρmax大于检测阈值范围的最大值,则进入长时啸叫判决过程最后获取啸叫帧;啸叫抑制模块,对啸叫帧进行啸叫衰减和消除处理。

    一种用于WASN的分布式语音噪声消除系统

    公开(公告)号:CN110739004A

    公开(公告)日:2020-01-31

    申请号:CN201911025413.4

    申请日:2019-10-25

    Abstract: 本发明公开了一种用于WASN的分布式语音噪声消除系统,包括相位对齐模块、离散傅里叶变换模块、语音活动检测模块、噪声功率谱密度估计模块、分布式参数多通道维纳滤波模块、分布式算法迭代模块和离散傅里叶反变换模块。在用于阵列的参数多通道维纳滤波算法的基础上,提出一种可以用于WASN的分布式语音噪声消除技术,它是一种可以应用在任意拓扑网络连接下的分布式语音噪声消除技术,本方法通过使用Metropolis权矩阵,在一定迭代次数下使每个节点处麦克风的输出信号均与含有数据处理中心的结果一致,并具有一定的鲁棒性。

    一种麦克风阵列频响校准方法

    公开(公告)号:CN107864444B

    公开(公告)日:2019-10-29

    申请号:CN201711057646.3

    申请日:2017-11-01

    Inventor: 陈喆 殷福亮 呼德

    Abstract: 本发明公开了一种麦克风阵列频响校准方法,包括以下步骤:S1:电音频信号w(n)经扬声器和声传播信道到达麦克风阵列,麦克风阵列输入声信号为x(n);S2:声信号x(n)经过k个不同的麦克风及前置放大器,分别得到不同的电信号x1(n)~xk(n);S3:电信号x1(n)~xk(n)分别当作各路校准滤波器的输入信号用于调整各校准滤波器的滤波系数;S4:根据上述调整方式,计算各校准滤波器的滤波系数,以完成麦克风阵列的频响校准。该方法使同一阵列中不同麦克风的频响接近一致,从而提高了麦克风阵列的信号处理能力。

    一种基于头相关脉冲响应的三维音频生成装置

    公开(公告)号:CN107820158A

    公开(公告)日:2018-03-20

    申请号:CN201710551437.8

    申请日:2017-07-07

    CPC classification number: H04R3/00 H04R2430/00

    Abstract: 本发明公开了一种基于头相关脉冲响应的三维音频生成方法,包括如下步骤:获得被测的人体生理特征参数,与头相关脉冲响应HRIR进行相关性分析;保留相关性超过阈值系数的人体生理特征参数;通过在数据库中寻找具有最小偏差之和的个体,得到当前被测人体的个性化HRIR,然后采用拉普拉斯特征映射降维(LEM)算法对HRIR进行插值;采用基于镜像模型ImageModel的前期反射混响器,对接收到的,包括在房间中的一次反射和二次反射的前期反射路径的输入音频与所述的HRIR进行卷积,恢复音频的方位信息;采用基于反馈延时网络FeedbackDelayNetwork,FDN的后期混响器得到混响音频;将所述的音频方位信息和混响音频相加,得到具有混响效果的三维音频,完成三维音频生成方法。

    一种基于火焰显著图和空间金字塔直方图的火灾检测方法

    公开(公告)号:CN105139429B

    公开(公告)日:2018-03-13

    申请号:CN201510503877.7

    申请日:2015-08-14

    Abstract: 一种基于火焰显著图和空间金字塔直方图的火灾检测方法,包括以下步骤:S1:计算图像中各像素点的强度变化值和前景度,采用连续帧做差法与高斯混合火焰颜色模型获取火焰显著图;S2:根据火焰显著图,采用阈值分割法筛选出候选火焰的像素点,构造含有候选火焰像素点的掩膜图像;S3:根据掩膜图像对原始图像进行分块处理判断每个子块是否含有火焰;S4:逐子块寻找前一帧图像中与之对应的子块,并利用连续帧对应子块的空间金字塔直方图间的距离判断图像是否存在火焰。

Patent Agency Ranking