-
公开(公告)号:CN108766465B
公开(公告)日:2020-07-28
申请号:CN201810572178.1
申请日:2018-06-06
Applicant: 华中师范大学
Abstract: 本发明属于音频信号处理领域,公开了一种基于ENF通用背景模型的数字音频篡改盲检测方法及系统,对大量的原始语音信号进行信号预处理,得到信号中包含的电网频率ENF成分;提取ENF信号的相位谱波动特征,相位谱和频率谱拟合参数特征,进行ENF通用背景模型训练;对已知ENF‑UBM进行自适应,得到原始信号的ENF模型;经过评分系统的处理,量化模型匹配度为分数标量;在监督学习条件下,绘制出ROC曲线,找到EER;根据EER的值计算正反例的分界值。本发明建立了原始语音信号ENF的通用背景模型,经过自适应过滤掉了大量与篡改特性无关的特征,并且其中的自适应部分还可目标数据库自行调整,具有较好的鲁棒性。
-
公开(公告)号:CN108831443B
公开(公告)日:2020-07-21
申请号:CN201810664855.2
申请日:2018-06-25
Applicant: 华中师范大学
Abstract: 本发明属于数字音频数据处理技术领域,公开了一种基于堆叠自编码网络的移动录音设备源识别方法,先提取纯净语音片段的RASTA‑MFCC特征训练一个GMM‑UBM模型,然后再基于特定设备源的语音片段提取RASTA‑MFCC特征,进而调整GMM的参数,并提取特定设备源的语音片段的相关对数谱的特征;最后将提取到的特征用来训练深度自编码网络,达到自动识别分类的要求。本发明在司法、新闻、知识产权、科学发现等领域,可确认数字音频的来源,对数字音频资料的真实性、完整性进行验证。本发明在语音识别和说话人识别领域,可分别检测训练和测试语音的设备信道信息,建立训练和测试语音之间的信道映射函数,从而解决信道失配问题。
-
公开(公告)号:CN108831506B
公开(公告)日:2020-07-10
申请号:CN201810662831.3
申请日:2018-06-25
Applicant: 华中师范大学
Abstract: 本发明属于涉及数字音频信号处理技术领域,公开了一种基于GMM‑BIC的数字音频篡改点检测方法及系统,使用GMM‑BIC方法代替了传统的SGM‑BIC用于数字音频篡改点检测,GMM的特性使得该方法可以表示更多的信息,对较长或者较短的语音段均有较好的表示效果;使用神经网络对拟合特征进行分类,得到更高的分类效果。本发明实现了数字音频篡改定位的自动化,自适应性好;针对相隔较近的拼接篡改点和使用各种噪声对篡改点进行掩饰的篡改操作,具有很强的鲁棒性;为数字音频篡改点检测的准确性和自动化提出了一种广泛性的算法。
-
公开(公告)号:CN109034213A
公开(公告)日:2018-12-18
申请号:CN201810734291.5
申请日:2018-07-06
Applicant: 华中师范大学
CPC classification number: G06K9/6268 , G06K9/66
Abstract: 本发明提供一种基于相关熵原则的高光谱图像分类方法和系统,首先,对输入图像进行预处理,使得所有光谱向量的元素值在0到1之间;其次,选取少量的样本作为训练样本,利用设计的融合维数约简方法与相关熵原则的层次模型,提取高光谱图像的空谱特征;然后,利用训练好的层次结构学习测试样本的空谱特征;最后,将测试样本的特征输入到KNN分类器中得到类标签。本发明利用相关熵原则充分结合了高光谱数据的光谱和空间特征;利用本发明的层次模型,可以获得更加抽象的空谱特征;由于LDA的特性,本发明具有较小的样本复杂度,仅需要少量的训练样本就可以得到比较好的分类结果,因此其更利于实际应用。
-
公开(公告)号:CN108766430A
公开(公告)日:2018-11-06
申请号:CN201810572146.1
申请日:2018-06-06
Applicant: 华中师范大学
Abstract: 本发明属于语音识别/说话人识别技术领域,公开了一种基于巴氏距离的语音特征映射方法及系统,首先分别提取复杂环境下语音信号和干净语音信号的特征;接着利用复杂特征和特征映射公式初始化映射特征,并分别建立映射特征与干净特征的GMM模型;然后用EM算法迭代估计两个GMM模型之间的最小巴氏距离,并得到最终的映射特征;最后将映射特征与已经训练完毕的干净环境下的语音信号模型进行模式匹配和识别。本发明通过最小化复杂特征GMM与干净特征GMM之间的巴氏距离来对复杂特征进行映射,得到映射特征,并将映射特征与干净模型进行模式匹配与识别;用映射特征代替复杂特征,能够有效提高语音识别的正确率。
-
公开(公告)号:CN107038424A
公开(公告)日:2017-08-11
申请号:CN201710263069.7
申请日:2017-04-20
Applicant: 华中师范大学
Abstract: 本发明属于手势识别技术领域,涉及一种手势识别方法,包括如下步骤:通过Kinect实时获取深度图像序列;通过Kinect实时获取手掌中心和手肘中心的位置,并根据每帧图像的深度信息提取手部轮廓;根据手掌中心位置、手肘中心位置和手部轮廓,计算指尖位置和指根位置,提取特征;将步骤3中提取的特征和模板库中的手势特征进行匹配,进入分类器,按分类器的分类标准选择出最接近的手势为识别出的手势,并将每一帧识别出的手势保存在队列Q中;分析队列Q中该帧和之前四帧的识别结果,选取出现数量最多的手势,作为最终识别结果。本发明使用Kinect获取深度信息,结合数字图像分析技术,能够快速准确的识别操控者的手势。
-
公开(公告)号:CN114638988B
公开(公告)日:2024-11-01
申请号:CN202210249839.3
申请日:2022-03-14
Applicant: 华中师范大学
IPC: G06V10/764 , G06V10/82 , G06V20/40 , G06V40/10 , G06V10/44 , G06N3/0464 , G06N3/084 , G06F16/75 , G06F16/783 , G06Q50/20 , G06V40/20
Abstract: 本发明属于人工智能技术领域,公开了一种基于不同呈现方式的教学视频自动化分类方法及系统,以三个卷积神经网络模型,通过自训练的两个YOLOV4目标检测神经网络模型和人体关键点检测技术可以准确的定位教学视频分类所需要的信息,解决了教学视频背景和人物特征改变不明显的问题,增加了特征提取的准确度。自建的卷积神经网络模型的结构适合进行Interview型和Head型两种教学视频分类,网络深度对比经典的几种视频分类算法来说刚好合适,减少了计算机硬件耗能。使用其它相关的图像数据集预处理后作为所需的训练集,突破了教学视频数据集上的瓶颈。提供了一种新的教学视频分类方式,提高了教学视频分类的正确率和效率。
-
公开(公告)号:CN113688789B
公开(公告)日:2023-11-10
申请号:CN202111091047.X
申请日:2021-09-17
Applicant: 华中师范大学
Abstract: 本发明设计了一种基于深度学习的在线学习投入度识别方法及系统,首先为了保证图像不受无关背景的影响,本发明通过YOLOv4进行学生人脸检测;其次针对VGG16网络参数量庞大、训练耗时等问题,提出了一种改进的VGG16模型,同时,在模型训练过程中,采用深度确定性信息瓶颈方法DIB弥补传统损失函数的不足,以获取较为紧致的特征表达,减少泛化误差,改善模型的通用性和稳定性,实现复杂在线学习场景下的学习投入度精准识别;最后通过与传统机器学习和其它深度学习等多种方法比较和分析,验证了本发明方法的有效性。
-
公开(公告)号:CN116957867A
公开(公告)日:2023-10-27
申请号:CN202310835921.9
申请日:2023-07-10
Applicant: 华中师范大学
Abstract: 本发明提供一种数字人教师线上教学服务方法、电子设备及计算机可读存储介质,包括知识点讲解、实时互动、作业管理、课后答疑、学习跟踪与评估,并对学习状态不良的同学进行预警,该教学服务装置及方法的服务涵盖学习者学习的全过程,为学习者系统学习知识提供了系统、全面的服务。另外,所述数字人教师线上教学服务装置及方法能应用于千人千面网络课程模式或一对一直播课模式。
-
公开(公告)号:CN113837258B
公开(公告)日:2023-09-08
申请号:CN202111091146.8
申请日:2021-09-17
Applicant: 华中师范大学
IPC: G06V10/764 , G06V10/774 , G06V10/77 , G06V10/58 , G06V20/13 , G06V20/10
Abstract: 本发明提供一种基于局部相关熵矩阵的高光谱图像分类方法和系统,首先,对高光谱图像数据进行降维处理,去除噪声并减小计算量,然后通过边界复制的方式对降维后的图像进行边界填充处理;其次,针对图像中的每一个像素,构建局部相关熵矩阵,抽取高光谱图像的局部特征;最后,将获得的局部相关熵矩阵作为特征输入到支持向量机中进行分类,得到每个像素的类别标签。本发明构建的局部相关熵矩阵充分利用了高光谱数据的“空谱合一”特性;利用本发明的方法,可以获取非线性的空谱特征;由于本发明属于手工设计特征方法,因此不需要大量的训练样本学习特征,具有较小的样本复杂度,更适合实际应用。
-
-
-
-
-
-
-
-
-