-
公开(公告)号:CN101482928B
公开(公告)日:2011-01-05
申请号:CN200910078295.3
申请日:2009-02-24
Applicant: 清华大学
IPC: G06T17/00
Abstract: 本发明公开了一种行为描述的方法和装置,属于行为识别技术领域。所述方法包括:获取三维行为者序列,三维行为者序列总共为K帧;根据三维行为者序列中的第一帧三维行为者,对选取的三维人体模型进行初始化;并计算第一姿势参数和第一三维人体关节点坐标;依次对第二帧三维行为者至第K帧三维行为者进行肢体部件分割和跟踪,得到第二帧三维行为者至第K帧三维行为者中的每帧三维行为者的姿势参数和三维人体关节点坐标;将所有三维人体关节点坐标合并为三维人体关节点坐标序列,将所有朝向参数合并为朝向参数序列,将所有空间位置参数合并为空间位置参数序列;用三维人体关节点坐标序列、朝向参数序列和空间位置参数序列描述三维行为者序列。
-
公开(公告)号:CN101561875A
公开(公告)日:2009-10-21
申请号:CN200910143325.4
申请日:2008-07-17
Applicant: 清华大学
Abstract: 本发明实施例公开了一种二维人脸图像定位的方法,属于计算机视觉和模式识别领域。所述方法包括:获取预设的数据库中的二维人脸图像;利用所述数据库中的二维人脸图像,构建二维人脸形状模型;利用所述数据库中的二维人脸图像,构建二维人脸局部纹理模型;根据所述二维人脸形状模型和二维人脸局部纹理模型,对所述二维人脸图像进行定位。本发明实施例通过利用预设的数据库建立二维人脸形状模型和二维人脸局部纹理模型,实现了对二维人脸图像进行精确定位,在局部纹理建模时使用点对比特征和特征选择相结合的方法,提高了计算速度和特征点的定位效果。
-
公开(公告)号:CN101320484A
公开(公告)日:2008-12-10
申请号:CN200810116781.5
申请日:2008-07-17
Applicant: 清华大学
Abstract: 本发明实施例公开了一种基于人脸全自动定位的三维人脸识别方法,属于计算机视觉和模式识别领域。所述人脸虚图像生成的方法包括:建立二维人脸形状模型和局部纹理模型,对二维人脸图像进行精确定位,根据定位结果,对所述二维人脸图像进行三维重建,得到三维人脸图像;对所述三维人脸图像进行光照模型处理,得到姿态、光照变化的虚图像。所述方法包括:从待识别的人脸图像中提取特征并压缩;根据压缩处理的特征对人脸进行识别。本发明实施例通过对二维人脸图像进行三维重建和光照模型处理生成虚图像,增加了图像的姿态和光照变化的样本空间,同时三维重建速度有很大的提高,使人脸图像的识别具有更高的效率和识别率。
-
公开(公告)号:CN100336070C
公开(公告)日:2007-09-05
申请号:CN200510086248.5
申请日:2005-08-19
Applicant: 清华大学
IPC: G06K9/00
Abstract: 复杂背景下的人脸检测技术属于人脸识别领域。其特征在于,提出了一种性能鲁棒的复杂背景下图像中的人脸检测方法。它采用高效率和高冗余度的微结构特征来表达人脸模式中眼睛、嘴巴等区域的灰度分布特点;并采用风险敏感的AdaBoost算法从中选择出最具有区分人脸和非人脸的微结构特征构成强分类器,使训练得到的每一层分类器在保证对人脸类别极低的拒识率的情况下,尽可能降低非人脸样本的误接受率,从而以更简单的结构实现复杂背景图像下更高性能的的人脸检测;另外还使用了后处理算法进一步降低误检率。在多个公开数据库上以及竞赛评测的结果证明了本发明的优异性能。
-
公开(公告)号:CN1333366C
公开(公告)日:2007-08-22
申请号:CN200510011510.X
申请日:2005-04-01
Applicant: 清华大学
IPC: G06K9/00
Abstract: 基于统计结构特征的联机手写汉字识别方法,属于汉字识别技术领域,其特征在于:先对处理的字符对象进行预处理,以消除噪声干扰,消除部分书写变形并把待识汉字所占空间映射到一个固定大小的位置;提取包括方向特征和边缘特征在内的能很好反映联机手写汉字特征在内的统计结构特征,再把得到的这些原始特征使用线性鉴别分析方法压缩变换为识别特征;最后采用改进了的高斯二次分类器模型完成训练和识别,该模型用一个事先设定的常数值代替较小的特征值以消除较小的特征值估计不准确对分类性能的不利影响。本发明的平均识别率为98.43%,取得令人满意的效果。
-
公开(公告)号:CN1332348C
公开(公告)日:2007-08-15
申请号:CN200510086478.1
申请日:2005-09-23
Applicant: 清华大学
IPC: G06K9/00
Abstract: 印刷体阿拉伯字符集文本切分方法属于光学字符识别中的字符切分领域。本发明特征在于:在字符块分类的基础上,选择部分字符块水平投影分割文本图像成子区域,然后检测多行子区域归并字符块实现多行子区域的文字行切分;随后估计文字行的基线和顶线位置,并把文字行切分成联体字符段;最后根据字符切点的特点寻找在基线上、基线上方及基线下方的切点,并且利用结构规则删除过切分点。本发明在多字体多字号印刷体阿拉伯文本测试集上的字符切分正确率达到99%以上。
-
公开(公告)号:CN1238816C
公开(公告)日:2006-01-25
申请号:CN03119130.4
申请日:2003-03-14
Applicant: 清华大学
Abstract: 基于单个汉字字符的字体识别方法属于汉字字体识别领域其特征在于,它是一种利用小波变换的与文本无关的字体识别方法它根据选定的层数J,用相应的尺度函数和小波函数的离散滤波器对离散信息作卷积处理,对原始图像进行J层小波变换,得到3J+1个子图像;再把各个子图像划分为子块,以每个子块中小波系数绝对值的加权和作为特征,经过整形处理后,得到原始图像的小波特征然后再利用线性鉴别分析从小波特征中提取字体识别特征,最后用高斯模型的二次分类器进行训练和识别本发明的平均识别率可达97.35%。
-
公开(公告)号:CN1570958A
公开(公告)日:2005-01-26
申请号:CN200410034107.4
申请日:2004-04-23
Applicant: 清华大学
Abstract: 多字体多字号印刷体藏文字符识别方法属于字符识别领域,其特征在于,提出了针对属于非方块字的印刷体藏文字符特点的归一化方案:将字符图像以基线,即上平线,为分界点分解成互不交叠的两个子图像,对每个子图像分别采用以重心和边框相结合的位置归一化和基于三次B样条函数插值的大小归一化方法;提取能充分反映藏文字符组成信息的四方向线素特征,利用线性鉴别分析LDA压缩降维后得到紧凑的字符特征向量。采用基于置信度分析的粗、细两级分类策略进行字符类别的判决,粗、细分类器分别采用带偏差的欧氏距离EDD和修正的二次鉴别函数MQDF。本发明在多字体多字号印刷体藏文单字测试集上的识别正确率达到99.83%,对实际文本的识别率也可达99%以上。
-
公开(公告)号:CN1459761A
公开(公告)日:2003-12-03
申请号:CN02117865.8
申请日:2002-05-24
Applicant: 清华大学
CPC classification number: G06K9/4609 , G06K2209/01
Abstract: 基于Gabor滤波器组的字符识别方法属于字符图像识别技术领域,其特征在于:在训练系统中依次含有以下步骤:用Gabor滤波器组抽取字符图像中各个方向的笔画,用平均熵相关系数求最优的滤波器参数;对Gabor滤波器组的输出结果作非线性后处理,以进一步增加识别系统对图像亮度、对比度变化以及图像干扰的抵抗能力;对Gabor滤波器组的输出中的正值和负值分别用高斯滤波器阵列计算识别特征,并合成为一个高维的特征矢量;用线性鉴别分析法降低特征矢量的维数,以增强识别性能,降低分类器的复杂度和计算量。该方法与具体的语种无关,成功的解决了低质量图像中的字符识别问题,对于印刷体和脱机手写汉字获得了目前最高的识别率。对身份证的总体识别率到达了90%以上,已经符合实用的要求。
-
公开(公告)号:CN1437162A
公开(公告)日:2003-08-20
申请号:CN03119130.4
申请日:2003-03-14
Applicant: 清华大学
Abstract: 基于单个汉字字符的字体识别方法属于汉字字体识别领域。其特征在于,它是一种利用小波变换的与文本无关的字体识别方法。它根据选定的层数J,用相应的尺度函数和小波函数的离散滤波器对离散信息作卷积处理,对原始图像进行J层小波变换,得到3J+1个子图像;再把各个子图像划分为子块,以每个子块中小波系数绝对值的加权和作为特征,经过整形处理后,得到原始图像的小波特征。然后再利用线性鉴别分析从小波特征中提取字体识别特征,最后用高斯模型的二次分类器进行训练和识别。本发明的平均识别率可达97.35%。
-
-
-
-
-
-
-
-
-