多字体多字号印刷体藏文字符识别方法

    公开(公告)号:CN1251130C

    公开(公告)日:2006-04-12

    申请号:CN200410034107.4

    申请日:2004-04-23

    Applicant: 清华大学

    Abstract: 多字体多字号印刷体藏文字符识别方法属于字符识别领域,其特征在于,提出了针对属于非方块字的印刷体藏文字符特点的归一化方案:将字符图像以基线,即上平线,为分界点分解成互不交叠的两个子图像,对每个子图像分别采用以重心和边框相结合的位置归一化和基于三次B样条函数插值的大小归一化方法;提取能充分反映藏文字符组成信息的四方向线素特征,利用线性鉴别分析LDA压缩降维后得到紧凑的字符特征向量。采用基于置信度分析的粗、细两级分类策略进行字符类别的判决,粗、细分类器分别采用带偏差的欧氏距离EDD和修正的二次鉴别函数MQDF。本发明在多字体多字号印刷体藏文单字测试集上的识别正确率达到99.83%,对实际文本的识别率也可达99%以上。

    几何代价和语义-识别代价融合的脱机手写汉字切分方法

    公开(公告)号:CN1719454A

    公开(公告)日:2006-01-11

    申请号:CN200510012195.2

    申请日:2005-07-15

    Applicant: 清华大学

    Abstract: 几何代价和语义-识别代价融合的脱机手写汉字切分方法,属于文字识别领域,其特征在于,首先通过对输入的脱机手写汉字的行图像进行分析,提取出笔段,将笔段合并成子字符块,同时给出子字符块合并的几何代价,由这些几何代价生成若干可能的候选切分方法,对每个方法用语言的二元语法模型进行评价,得到每种切分方式的语义-识别代价,最后综合几何与语义-识别代价给出最优的切分识别方案。本发明应用于手写信封地址的切分与识别上,其切分正确率可以达到93%,大大改进了传统切分方法的性能,对于其他语言文字或领域的切分问题也有一定的指导作用。

    基于游程邻接图的复杂背景彩色图像中字符提取方法

    公开(公告)号:CN1588431A

    公开(公告)日:2005-03-02

    申请号:CN200410062261.2

    申请日:2004-07-02

    Applicant: 清华大学

    Abstract: 基于游程邻接图的复杂背景彩色图像中字符提取方法,属于彩色图像文字识别预处理中的文字字符提取领域。在得到数字彩色图像之后,首先使用CRAG(color run-length adjacency graph)区域生长算法得到图像的所有彩色连通域,再通过对这些连通域的颜色平均值进行颜色聚类,得到若干个颜色中心,以此颜色中心形成不同的颜色层面,然后将符合连通域判别规则的彩色连通域分到若干个颜色层面上。最后通过特征分析和大小一致性判据从颜色层面中挑选出文字字符图像层面,获得在文字图像层面的字符图像。该算法解决了彩色文字字符笔画图像渐变的字符图像提取问题,并具有较高的提取速度,具有较高的提取准确率,同时保留了文字和背景图像的原始色彩,便于将来的图像恢复。

    一种基于多任务学习的场景文本检测方法及系统

    公开(公告)号:CN115546778B

    公开(公告)日:2023-06-13

    申请号:CN202211298048.6

    申请日:2022-10-22

    Applicant: 清华大学

    Abstract: 本发明公开了一种基于多任务学习的场景文本检测方法及系统,该方法包括:将场景图像输入至文本检测模型,文本检测模型,包括主干网络、特征金字塔网络、区域候选网络和检测网络,其中,利用主干网络和特征金字塔网络对场景图像进行特征提取,得到多尺度特征图,将多尺度特征图输入区域候选网络得到候选区域特征图,并利用检测网络对候选区域特征图进行文本检测得到文本检测结果;其中,检测网络的结构,包括外接框回归分支、掩膜预测分支与文本识别分支的多任务学习级联细化网络结构。本发明对于场景图像复杂的前景和背景变化有较强的适应能力,可以提高文本检测性能。

    一种基于多任务学习的场景文本检测方法及系统

    公开(公告)号:CN115546778A

    公开(公告)日:2022-12-30

    申请号:CN202211298048.6

    申请日:2022-10-22

    Applicant: 清华大学

    Abstract: 本发明公开了一种基于多任务学习的场景文本检测方法及系统,该方法包括:将场景图像输入至文本检测模型,文本检测模型,包括主干网络、特征金字塔网络、区域候选网络和检测网络,其中,利用主干网络和特征金字塔网络对场景图像进行特征提取,得到多尺度特征图,将多尺度特征图输入区域候选网络得到候选区域特征图,并利用检测网络对候选区域特征图进行文本检测得到文本检测结果;其中,检测网络的结构,包括外接框回归分支、掩膜预测分支与文本识别分支的多任务学习级联细化网络结构。本发明对于场景图像复杂的前景和背景变化有较强的适应能力,可以提高文本检测性能。

    基于Gabor滤波器组的字符识别技术

    公开(公告)号:CN1459761B

    公开(公告)日:2010-04-21

    申请号:CN02117865.8

    申请日:2002-05-24

    Applicant: 清华大学

    CPC classification number: G06K9/4609 G06K2209/01

    Abstract: 基于Gabor滤波器组的字符识别方法属于字符图像识别技术领域,其特征在于:在训练系统中依次含有以下步骤:用Gabor滤波器组抽取字符图像中各个方向的笔画,用平均熵相关系数求最优的滤波器参数;对Gabor滤波器组的输出结果作非线性后处理,以进一步增加识别系统对图像亮度、对比度变化以及图像干扰的抵抗能力;对Gabor滤波器组的输出中的正值和负值分别用高斯滤波器阵列计算识别特征,并合成为一个高维的特征矢量;用线性鉴别分析法降低特征矢量的维数,以增强识别性能,降低分类器的复杂度和计算量。该方法与具体的语种无关,成功的解决了低质量图像中的字符识别问题,对于印刷体和脱机手写汉字获得了目前最高的识别率。对身份证的总体识别率到达了90%以上,已经符合实用的要求。

    图像匹配方法
    17.
    发明授权

    公开(公告)号:CN100530222C

    公开(公告)日:2009-08-19

    申请号:CN200710176039.9

    申请日:2007-10-18

    Applicant: 清华大学

    Abstract: 本发明公开了一种图像匹配方法,属于图像匹配技术领域。所述方法包括:利用MSER方法检测出待匹配的图像中的同质区域;采用椭圆区域方程对检测到的每个同质区域进行拟合;采用椭圆形梯度直方图和多尺度图像分解抽取经过椭圆区域方程拟合后的同质区域所在测量区域的特征向量;采用分层k均值聚类算法构造同质区域集合的二叉树,进行图像匹配;采用结合二叉树的渐进式方法构建感兴趣区域的分类器,进行图像匹配。本发明结合图像尺度空间和统计学习方法大大地降低了提取图像特征向量的复杂度和局部区域匹配复杂度,同时增强了图像匹配算法的稳定性。

    一种基于人脸生理性运动的活体检测方法及系统

    公开(公告)号:CN100514353C

    公开(公告)日:2009-07-15

    申请号:CN200710178088.6

    申请日:2007-11-26

    Applicant: 清华大学

    CPC classification number: G06K9/00899 G06K9/00221

    Abstract: 本发明公开了一种基于人脸生理性运动的活体检测方法及系统,属于人脸识别技术领域。所述方法包括:步骤A:检测系统摄像视角内物体的运动区域和运动方向,锁定人脸检测结果框;步骤B:判断所述人脸检测结果框内是否存在有效的人脸面部运动,如果不存在,则认为是照片人脸,如果存在,则转入步骤C;步骤C:判断所述人脸检测结果框内的所述人脸面部运动是否为生理性运动,如果不是,则认为是照片人脸,如果是,则认为是真实人脸。所述系统包括:检测运动模块、有效人脸面部运动判断模块和生理性运动判断模块。通过本发明所述技术方案,可以区别真实人脸与照片人脸,提高人脸识别系统的可靠性。

    印刷蒙古文文本切分方法
    19.
    发明授权

    公开(公告)号:CN100470582C

    公开(公告)日:2009-03-18

    申请号:CN200710065195.8

    申请日:2007-04-06

    Applicant: 清华大学

    Abstract: 印刷蒙古文文本切分方法,属于光学字符识别中的字符切分领域。本发明特征在于:在连通体分类的基础上,选择部分连通体竖直投影,分割文本图像成子区域,然后检测多列子区域,归并字符块实现多列子区域的文字列切分;随后把文字列切分成词;接着估计文字列各处的基线位置;最后根据基线位置和词轮廓寻找字素切点,把词切分成字素。本发明在多字体多字号印刷蒙古文文本测试集上的字素切分正确率达到98.5%以上。

    一种基于人脸生理性运动的活体检测方法及系统

    公开(公告)号:CN101159016A

    公开(公告)日:2008-04-09

    申请号:CN200710178088.6

    申请日:2007-11-26

    Applicant: 清华大学

    CPC classification number: G06K9/00899 G06K9/00221

    Abstract: 本发明公开了一种基于人脸生理性运动的活体检测方法及系统,属于人脸识别技术领域。所述方法包括:步骤A:检测系统摄像视角内物体的运动区域和运动方向,锁定人脸检测结果框;步骤B:判断所述人脸检测结果框内是否存在有效的人脸面部运动,如果不存在,则认为是照片人脸,如果存在,则转入步骤C;步骤C:判断所述人脸检测结果框内的所述人脸面部运动是否为生理性运动,如果不是,则认为是照片人脸,如果是,则认为是真实人脸。所述系统包括:检测运动模块、有效人脸面部运动判断模块和生理性运动判断模块。通过本发明所述技术方案,可以区别真实人脸与照片人脸,提高人脸识别系统的可靠性。

Patent Agency Ranking