图像中文本区域定位方法和装置

    公开(公告)号:CN102855478A

    公开(公告)日:2013-01-02

    申请号:CN201110192175.3

    申请日:2011-06-30

    Abstract: 本发明公开了一种图像中文本区域定位方法和装置。根据本发明的图像中文本区域定位方法包括:估计输入图像中每个像素周围可能存在的文本大小;根据所述文本大小和区域差异度从所述输入图像中提取候选笔划区域;从所述候选笔划区域中确定真实笔划区域;以及合并所述真实笔划区域以形成文本区域。

    基于子结构学习的手写中文识别方法

    公开(公告)号:CN103324929B

    公开(公告)日:2016-05-18

    申请号:CN201310255159.3

    申请日:2013-06-25

    Inventor: 朱远平 何源 孙俊

    Abstract: 本发明公开了一种基于子结构学习的手写中文识别方法,将字符分割片段视为汉字的子结构,从汉字分割片段样本中提取汉字子结构模式,并将汉字子结构模式纳入汉字分类器训练中,最后结合子结构识别信息和汉字子结构组成信息实现手写中文字符串的识别。本发明基于汉字是由一个或多个子结构组成的这一特点,通过提取汉字子结构,并在汉字分类器中将汉字子结构和汉字单字同时进行训练,能有效提高手写中文字符串识别过程中字符分割片段的识别可靠性,减少由于不可靠的字符分割片段识别导致手写中文字符串的识别错误,提高手写汉字识别精度。

    一种关键词获取方法及装置

    公开(公告)号:CN102779140B

    公开(公告)日:2015-09-02

    申请号:CN201110128161.5

    申请日:2011-05-13

    CPC classification number: G06F17/30253 G06K9/2054 G06K2209/01

    Abstract: 本发明实施例公开了一种关键词获取方法,包括:定位图像中的文字区域,并利用OCR技术识别出所述文字区域中的文字内容;从所识别出的文字内容中,选择第一类待定关键词进行网页搜索;在搜索到的网页中提取第二类待定关键词;以及至少根据所述第二类待定关键词确定所述图像对应的关键词。通过本发明实施例将OCR技术与网页搜索的技术相结合,基于根据OCR技术识别及选择出的第一类待定关键词进行网页搜索,保证了关键词的收敛性,然后基于搜索到的网页选择第二类待定关键词保证了关键词的正确性,从而提高了最终确定的图像对应的关键词的精确度。

    文档图像二值化方法及其装置,以及文档图像处理器

    公开(公告)号:CN101727582B

    公开(公告)日:2014-02-19

    申请号:CN200810171182.3

    申请日:2008-10-22

    Inventor: 朱远平

    Abstract: 一种对文档图像进行二值化的方法,包括:学习步骤,通过预定的第一二值化算法从类型相同的至少一个待二值化的文档图像中选取预定数量的文档图像作为训练样本进行学习,以获得训练样本所对应的二值图像的属性,作为所述至少一个待二值化的文档图像所对应的二值图像的公共参考属性;和二值化优化处理步骤,通过预定的第二二值化算法,根据公共参考属性对至少一个待二值化的文档图像中的每一个进行二值化优化处理,以使得每一个所得到的最终二值图像的属性与所述公共参考属性相一致。还提供一种可执行上述方法的对文档图像二值化装置,及配备有该装置的文档图像处理器。本发明的方法和装置可获得更加优化的二值化效果并提高二值化质量稳定性。

    基于子结构学习的手写中文识别方法

    公开(公告)号:CN103324929A

    公开(公告)日:2013-09-25

    申请号:CN201310255159.3

    申请日:2013-06-25

    Inventor: 朱远平 何源 孙俊

    Abstract: 本发明公开了一种基于子结构学习的手写中文识别方法,将字符分割片段视为汉字的子结构,从汉字分割片段样本中提取汉字子结构模式,并将汉字子结构模式纳入汉字分类器训练中,最后结合子结构识别信息和汉字子结构组成信息实现手写中文字符串的识别。本发明基于汉字是由一个或多个子结构组成的这一特点,通过提取汉字子结构,并在汉字分类器中将汉字子结构和汉字单字同时进行训练,能有效提高手写中文字符串识别过程中字符分割片段的识别可靠性,减少由于不可靠的字符分割片段识别导致手写中文字符串的识别错误,提高手写汉字识别精度。

    将彩色图像转换为灰度图像的装置和方法

    公开(公告)号:CN102881001A

    公开(公告)日:2013-01-16

    申请号:CN201110195905.5

    申请日:2011-07-13

    Abstract: 本发明涉及将彩色图像转换为灰度图像的装置和方法,所述方法包括如下的步骤:(a)在所述彩色图像的图像空间中选取初始的投影轴;(b)利用所述投影轴,将所述彩色图像转换为灰度图像;(c)确定所述灰度图像的灰度图像评价指标;(d)变换所述投影轴;重复所述步骤(b)至步骤(d),直到投影轴的集合覆盖了所述图像空间的预定范围,从而获得多个灰度图像和分别与所述多个灰度图像相对应的多个灰度图像评价指标;(e)确定多个灰度图像评价指标中的最佳的灰度图像评价指标,并将与所述最佳的灰度图像评价指标相对应的灰度图像确定为所述彩色图像应转换为的灰度图像。

    基于鉴别归一化的手写汉字识别方法

    公开(公告)号:CN102831434A

    公开(公告)日:2012-12-19

    申请号:CN201210225810.8

    申请日:2012-07-03

    Inventor: 朱远平 何源 孙俊

    Abstract: 本发明公开了一种基于鉴别归一化的手写汉字识别方法,本发明提出的方法将鉴别信息结合到字符图像归一化中,从而有效增强归一化后的字符图像的鉴别能力。使用基于鉴别归一化的手写汉字识别能显著减少相似字识别错误,增强手写汉字的识别精度。相比不使用鉴别归一化的手写汉字识别方法,使用鉴别归一化的手写汉字识别精度可获得较大的提高。

    拒识方法和拒识装置
    19.
    发明公开

    公开(公告)号:CN102279927A

    公开(公告)日:2011-12-14

    申请号:CN201010195920.5

    申请日:2010-06-08

    Abstract: 本发明公开了一种基于拒识阈值映射对拒识判决进行优化的拒识方法和拒识装置。根据本发明一个实施例的拒识方法包括:从样本集合中搜索与中间识别结果相匹配的样本组;使用与匹配的样本组相对应的拒识阈值映射函数计算拒识阈值;以及根据计算的拒识阈值对识别结果进行拒识处理。

    构建级联分类器的方法、识别对象的方法及装置

    公开(公告)号:CN101964059A

    公开(公告)日:2011-02-02

    申请号:CN200910161237.7

    申请日:2009-07-24

    Abstract: 公开了构建级联分类器的方法、识别对象的方法以及装置。该方法包括:基于第一级样本集来构建第一级节点分类器作为临时级联分类器,循环执行以下步骤:基于下级样本集来构建下级节点分类器,下级样本集是上级样本集中针对上级节点分类器的上级识别分数小于与上级节点分类器相对应的上级识别分数阈值与大于或等于0的识别分数阈值偏量之和的样本的集合;将下级节点分类器与临时级联分类器级联以构建新的临时级联分类器;比较增加该下级节点分类器前后的临时级联分类器的识别精度;如果增加下级节点分类器后识别精度不变或降低,则将删除下级节点分类器后的临时级联分类器确定为最终的级联分类器并终止循环,否则继续构建下一个下级节点分类器。

Patent Agency Ranking