-
公开(公告)号:CN104636725A
公开(公告)日:2015-05-20
申请号:CN201510058032.1
申请日:2015-02-04
Applicant: 华中科技大学
Abstract: 本发明公开了一种基于深度图像的手势识别方法,训练数据集和测试数据集中的深度图像通过深度传感器采集得到,首先计算图像中人体区域的最小深度值,再利用深度阈值,结合人手是离传感器最近物体的预设条件,分割出深度图像中的手势;然后获取手势在三个正交平面上的投影图,分别称为正视投影图、侧视投影图和顶视投影图;接着提取三个投影图的轮廓片段包特征,并级联成原始深度手势的特征向量;最后训练分类器,对从待识别深度图像中获取的手势特征向量进行分类,得到待识别手势的识别结果。本发明还提供了相应的手势识别系统。本发明方法手势识别简单易行,推广能力强,识别准确率高,能有效克服杂乱背景、光照、噪声及自遮挡等不利因素的影响。
-
公开(公告)号:CN100433837C
公开(公告)日:2008-11-12
申请号:CN200410012857.1
申请日:2004-03-18
Applicant: 华中科技大学
Abstract: 本发明属于图象处理技术,特别涉及视频编解码器中图像数据压缩的整数变换,针对当前我国将要制定的第一个音视频编码标准(AVS)采用8乘8整数类DCT变换,提出了一种整数变换的变换基选择方法,综合评价变换基的去相关效率和能量集中率两项指标及变换基变换动态范围和计算复杂度,并通过此方法提出两组性能优异的8乘8整数变换基(5,6,4,1)和(4,5,3,1),并得到基于这两组基的整数变换快速算法。
-
公开(公告)号:CN100348051C
公开(公告)日:2007-11-07
申请号:CN200510018489.6
申请日:2005-03-31
Applicant: 华中科技大学
Abstract: 本发明属于信号处理中的视频编解码领域,涉及一种增强型帧内预测模式编码方法。其特点在于:利用相邻图像块的纹理的空间相关性,根据相邻块之间最佳预测模式的关系,统计确定视频的最可能预测模式表,从而提高帧内编码时预测精度。本发明方法包括:统计相邻块之间最佳预测模式的关系,建立最可能预测模式查找表;在编码端,根据左邻块和上邻块的预测模式查表得出当前块的最可能预测模式,然后进行相应的帧内预测编码操作;在解码端,根据左邻块和上邻块的预测模式查表得出当前块的最可能预测模式,然后进行相应的帧内预测解码操作。本发明所提出的方法简单易行,能有效增加帧内编码时预测精度,从而提高视频的编码效率。
-
公开(公告)号:CN101005615A
公开(公告)日:2007-07-25
申请号:CN200610033171.X
申请日:2006-01-18
Abstract: 本发明适用于图像处理领域,提供了一种图像数据水印信息的嵌入、检测方法及系统,所述方法包括下述步骤:A.利用离散余弦变换的低频系数在原始图像数据帧中提取多个特征块;B.在所述特征块的离散余弦变换域中频部分嵌入水印信息;C.根据所述多个特征块确定同步块的位置;D.在所述同步块中嵌入同步标记。本发明在DCT域中选取特征块作为水印信息嵌入点,并利用特征块的统计特性进行水印信息检测时的几何校准,能够有效地抵御几何攻击。在检测时,计算特征块的统计特性确定同步块的位置,估计图像数据帧的几何失真并对几何失真进行恢复,完成水印信息的检测,实现复杂度较低,能满足实时应用的需求。
-
公开(公告)号:CN1285214C
公开(公告)日:2006-11-15
申请号:CN200410012658.0
申请日:2004-01-14
Applicant: 华中科技大学
Abstract: 本发明公开了一种环路滤波方法,其步骤为①计算块效应值和像素差值,并加以判断,②根据判断结果,分别进行均值滤波、差值滤波或不滤波。环路滤波器,包括滤波判别区和滤波执行区;前者包括图像存储单元、门限值确定单元、像素差值单元、滤波判别单元和块效应值计算单元,用于计算块效应值和像素差值;后者包括激发单元、滤波确定器、均值滤波器和差值滤波器,用于滤波处理。本发明可以有效地去除视频编码之后的块效应,主观图像质量改善明显。客观上图像的信噪比psnr实验证明平均提高0.20dB,比特率平均下降2%,且该发明可稳定应用于AVS视频编码器中。
-
公开(公告)号:CN1275469C
公开(公告)日:2006-09-13
申请号:CN200410061094.X
申请日:2004-11-10
Applicant: 华中科技大学
Abstract: 本发明公开了一种复杂度可分级的帧内预测方法,利用其相邻块与当前编码图像块的纹理相关性,定义图像块及其参考相邻块的位置关系映射图;对边缘图像块直接指定其预测模式,然后作预测模式处理确定最优预测模式,并按此模式对图像块进行编码;对中心图像块则根据参考相邻块的有效预测模式确定当前图像块的可选预测模式,然后作预测模式处理确定局部最优预测模式;然后根据当前编码器的计算能力冗余度,再次确定当前图像块的可选预测模式,确定最终的最优预测模式,并按此模式对图像块进行编码。本发明可实现帧内预测最优模式的快速选择,并实现对帧内预测复杂度准确的控制。
-
公开(公告)号:CN1674680A
公开(公告)日:2005-09-28
申请号:CN200510018489.6
申请日:2005-03-31
Applicant: 华中科技大学
Abstract: 本发明属于信号处理中的视频编解码领域,涉及一种增强型帧内预测模式编码方法。其特点在于:利用相邻图像块的纹理的空间相关性,根据相邻块之间最佳预测模式的关系,统计确定视频的最有可能预测模式表,从而提高帧内编码时预测精度。本发明方法包括:统计相邻块之间最佳预测模式的关系,建立最有可能预测模式查找表;在编码端,根据左邻块和上邻块的预测模式查表得出当前块的最有可能预测模式,然后进行相应的帧内预测编码操作;在解码端,根据左邻块和上邻块的预测模式查表得出当前块的最有可能预测模式,然后进行相应的帧内预测解码操作。本发明所提出的方法简单易行,能有效增加帧内编码时预测精度,从而提高视频的编码效率。
-
公开(公告)号:CN118366143A
公开(公告)日:2024-07-19
申请号:CN202410489150.7
申请日:2024-04-23
Applicant: 华中科技大学
IPC: G06V20/62 , G06V20/40 , G06V10/44 , G06V30/18 , G06N3/042 , G06N3/045 , G06N3/0464 , G06V10/80 , G06T7/246
Abstract: 本发明公开一种基于拓扑结构特征关联的视频文字跟踪方法:先利用文本检测器针对视频帧生成高召回的文本检测框,再基于三阶段匹配的关联策略进行前后帧文本实例之间的特征匹配,最终生成视频中包含同一文本目标位置信息和身份信息的所有轨迹。将文本检测结果划分为高分框和低分框并先后同未配对轨迹进行第一、第二阶段的数据关联匹配,再针对第二阶段的中断轨迹利用局部搜索跟踪器参考历史轨迹文本特征以进行断点处遗漏文本框的局部搜索,在第三阶段进行局部搜索文本与未配对轨迹的数据关联匹配。该方法准确高效,在多个主流的视频文字跟踪基准上实现了最佳的跟踪精度及可观效率。本发明还提供了相应的基于拓扑结构特征关联的视频文字跟踪装置。
-
公开(公告)号:CN117765590A
公开(公告)日:2024-03-26
申请号:CN202311785920.4
申请日:2023-12-22
Applicant: 华中科技大学
IPC: G06V40/16 , G06V10/80 , G06V10/82 , G06V10/26 , G06V10/764 , G06V20/70 , G06N3/045 , G06N3/084 , G06N3/092
Abstract: 本发明公开一种基于Transformer的面部注视估计方法:(1)训练基于朴素视觉Transformer的强化融合的注视估计算法模型,包括:(1.1)对原始数据集中的所有图片的面部特征区域进行识别和标注,以进行数据清理并得到带有统一高精度标注的标准数据集,标签为实例级别的包围框的左上及右下顶点;(1.2)构建基于朴素视觉Transformer的强化融合的面部注视特征提取架构,利用多重面部注视特征编码及特征间长距离建模提取及融合特征语义信息;(1.3)利用上述提取出的强化语义信息融合的面部注视特征进行注视估计;(2)利用上述训练好的模型进行注视估计。本发明通过对突出面部局部特征信息和全局特征信息间的强化融合,更完整且精确的提取面部特征信息以进行注视估计。
-
公开(公告)号:CN117173790A
公开(公告)日:2023-12-05
申请号:CN202311190366.5
申请日:2023-09-14
Applicant: 华中科技大学
IPC: G06V40/20 , G06V10/774 , G06V10/82 , G06N3/0464
Abstract: 本发明公开了一种基于因果干预机制的步态识别方法:对于待检测的步态序列,首先经过特征提取以及时域下采样获取低级步态特征;然后经过由多个事实与反事实模块构成的因果干预学习器,最后用于特征映射生成步态特征。事实与反事实模块可以通过最大化事实与反事实特征表达之间的分布差异,使得步态模型更加关注于反映步态特征的区域,从而减少混杂因素对步态识别的干扰,并且该模块可移植性强,适用于多种主流步态识别网络。本发明还提供了相应的基于因果干预机制的步态识别装置。
-
-
-
-
-
-
-
-
-