一种基于ENF通用背景模型的数字音频篡改盲检测方法

    公开(公告)号:CN108766465B

    公开(公告)日:2020-07-28

    申请号:CN201810572178.1

    申请日:2018-06-06

    Abstract: 本发明属于音频信号处理领域,公开了一种基于ENF通用背景模型的数字音频篡改盲检测方法及系统,对大量的原始语音信号进行信号预处理,得到信号中包含的电网频率ENF成分;提取ENF信号的相位谱波动特征,相位谱和频率谱拟合参数特征,进行ENF通用背景模型训练;对已知ENF‑UBM进行自适应,得到原始信号的ENF模型;经过评分系统的处理,量化模型匹配度为分数标量;在监督学习条件下,绘制出ROC曲线,找到EER;根据EER的值计算正反例的分界值。本发明建立了原始语音信号ENF的通用背景模型,经过自适应过滤掉了大量与篡改特性无关的特征,并且其中的自适应部分还可目标数据库自行调整,具有较好的鲁棒性。

    一种基于堆叠自编码网络的移动录音设备源识别方法

    公开(公告)号:CN108831443B

    公开(公告)日:2020-07-21

    申请号:CN201810664855.2

    申请日:2018-06-25

    Abstract: 本发明属于数字音频数据处理技术领域,公开了一种基于堆叠自编码网络的移动录音设备源识别方法,先提取纯净语音片段的RASTA‑MFCC特征训练一个GMM‑UBM模型,然后再基于特定设备源的语音片段提取RASTA‑MFCC特征,进而调整GMM的参数,并提取特定设备源的语音片段的相关对数谱的特征;最后将提取到的特征用来训练深度自编码网络,达到自动识别分类的要求。本发明在司法、新闻、知识产权、科学发现等领域,可确认数字音频的来源,对数字音频资料的真实性、完整性进行验证。本发明在语音识别和说话人识别领域,可分别检测训练和测试语音的设备信道信息,建立训练和测试语音之间的信道映射函数,从而解决信道失配问题。

    基于相关熵原则的高光谱图像分类方法和系统

    公开(公告)号:CN109034213A

    公开(公告)日:2018-12-18

    申请号:CN201810734291.5

    申请日:2018-07-06

    CPC classification number: G06K9/6268 G06K9/66

    Abstract: 本发明提供一种基于相关熵原则的高光谱图像分类方法和系统,首先,对输入图像进行预处理,使得所有光谱向量的元素值在0到1之间;其次,选取少量的样本作为训练样本,利用设计的融合维数约简方法与相关熵原则的层次模型,提取高光谱图像的空谱特征;然后,利用训练好的层次结构学习测试样本的空谱特征;最后,将测试样本的特征输入到KNN分类器中得到类标签。本发明利用相关熵原则充分结合了高光谱数据的光谱和空间特征;利用本发明的层次模型,可以获得更加抽象的空谱特征;由于LDA的特性,本发明具有较小的样本复杂度,仅需要少量的训练样本就可以得到比较好的分类结果,因此其更利于实际应用。

    一种基于巴氏距离的语音特征映射方法及系统

    公开(公告)号:CN108766430A

    公开(公告)日:2018-11-06

    申请号:CN201810572146.1

    申请日:2018-06-06

    Abstract: 本发明属于语音识别/说话人识别技术领域,公开了一种基于巴氏距离的语音特征映射方法及系统,首先分别提取复杂环境下语音信号和干净语音信号的特征;接着利用复杂特征和特征映射公式初始化映射特征,并分别建立映射特征与干净特征的GMM模型;然后用EM算法迭代估计两个GMM模型之间的最小巴氏距离,并得到最终的映射特征;最后将映射特征与已经训练完毕的干净环境下的语音信号模型进行模式匹配和识别。本发明通过最小化复杂特征GMM与干净特征GMM之间的巴氏距离来对复杂特征进行映射,得到映射特征,并将映射特征与干净模型进行模式匹配与识别;用映射特征代替复杂特征,能够有效提高语音识别的正确率。

    一种手势识别方法
    26.
    发明公开

    公开(公告)号:CN107038424A

    公开(公告)日:2017-08-11

    申请号:CN201710263069.7

    申请日:2017-04-20

    Abstract: 本发明属于手势识别技术领域,涉及一种手势识别方法,包括如下步骤:通过Kinect实时获取深度图像序列;通过Kinect实时获取手掌中心和手肘中心的位置,并根据每帧图像的深度信息提取手部轮廓;根据手掌中心位置、手肘中心位置和手部轮廓,计算指尖位置和指根位置,提取特征;将步骤3中提取的特征和模板库中的手势特征进行匹配,进入分类器,按分类器的分类标准选择出最接近的手势为识别出的手势,并将每一帧识别出的手势保存在队列Q中;分析队列Q中该帧和之前四帧的识别结果,选取出现数量最多的手势,作为最终识别结果。本发明使用Kinect获取深度信息,结合数字图像分析技术,能够快速准确的识别操控者的手势。

    一种基于深度学习的在线学习投入度识别方法及系统

    公开(公告)号:CN113688789B

    公开(公告)日:2023-11-10

    申请号:CN202111091047.X

    申请日:2021-09-17

    Abstract: 本发明设计了一种基于深度学习的在线学习投入度识别方法及系统,首先为了保证图像不受无关背景的影响,本发明通过YOLOv4进行学生人脸检测;其次针对VGG16网络参数量庞大、训练耗时等问题,提出了一种改进的VGG16模型,同时,在模型训练过程中,采用深度确定性信息瓶颈方法DIB弥补传统损失函数的不足,以获取较为紧致的特征表达,减少泛化误差,改善模型的通用性和稳定性,实现复杂在线学习场景下的学习投入度精准识别;最后通过与传统机器学习和其它深度学习等多种方法比较和分析,验证了本发明方法的有效性。

    基于局部相关熵矩阵的高光谱图像分类方法和系统

    公开(公告)号:CN113837258B

    公开(公告)日:2023-09-08

    申请号:CN202111091146.8

    申请日:2021-09-17

    Abstract: 本发明提供一种基于局部相关熵矩阵的高光谱图像分类方法和系统,首先,对高光谱图像数据进行降维处理,去除噪声并减小计算量,然后通过边界复制的方式对降维后的图像进行边界填充处理;其次,针对图像中的每一个像素,构建局部相关熵矩阵,抽取高光谱图像的局部特征;最后,将获得的局部相关熵矩阵作为特征输入到支持向量机中进行分类,得到每个像素的类别标签。本发明构建的局部相关熵矩阵充分利用了高光谱数据的“空谱合一”特性;利用本发明的方法,可以获取非线性的空谱特征;由于本发明属于手工设计特征方法,因此不需要大量的训练样本学习特征,具有较小的样本复杂度,更适合实际应用。

Patent Agency Ranking