识别纠偏系统及方法
    1.
    发明公开

    公开(公告)号:CN108416349A

    公开(公告)日:2018-08-17

    申请号:CN201810087635.8

    申请日:2018-01-30

    IPC分类号: G06K9/32 G06K9/72

    摘要: 本发明涉及一种识别纠偏系统和方法,对纸质单据信息进行数据化处理,包括:图像获取单元,用于获取纸质单据图像;识别单元,用于识别所述单据图像中的文字,得到单据的识别结果数据集;信息纠偏单元,用于对所述识别结果数据集进行纠偏,得到纠偏后的单据信息;数据存储单元,用于存储信息数据库、所述单据图像、所述单据的识别结果数据集及所述纠偏后的单据信息。其中,所述信息数据库为所述信息纠偏单元的训练数据。本发明涉及的一种识别纠偏系统和方法,改善了OCR技术识别文字序列精度准确率较低的弊端。

    判断重复笔画的方法、终端设备及计算机可读存储介质

    公开(公告)号:CN107169517A

    公开(公告)日:2017-09-15

    申请号:CN201710332003.9

    申请日:2017-05-11

    发明人: 周忠杰

    IPC分类号: G06K9/62 G06K9/34

    摘要: 本发明适用于通信技术领域,提供了判断重复笔画的方法、终端设备及计算机可读存储介质,所述方法包括:获取用户书写的字符;对所述用户书写的所述字符进行识别,以获得与所述用户书写的所述字符相匹配的标准字符;分别获取所述用户书写所述字符时的笔画数和所述标准字符的笔画数;若所述用户书写所述字符时的笔画数与所述标准字符的笔画数不相同,则从所述用户书写的所述字符中提取相同的笔画;若从所述用户书写的所述字符中提取的相同的笔画的笔顺相邻且该相同的笔画有重合,则确定从所述用户书写的所述字符中提取的相同的笔画为重复笔画。通过本发明解决了现有技术未对用户书写的字符中是否存在重复笔画的情况进行检测的问题。

    图像处理装置以及电子文件生成方法

    公开(公告)号:CN106488074A

    公开(公告)日:2017-03-08

    申请号:CN201610707906.6

    申请日:2016-08-23

    发明人: 堤隆弘

    IPC分类号: H04N1/41 H04N1/64

    摘要: 提供一种图像处理装置以及电子文件生成方法,能自动生成将文件尺寸维持得小的同时即便是小尺寸的字符、复杂的字符也能确保充分的可读性的电子文件。通过字符区域抽出单元从包含字符的图像数据抽出多个字符区域,通过计算单元计算抽出的字符区域中的字符尺寸和字符的复杂度,而且根据字符尺寸和字符的复杂度,通过计算单元计算每个字符区域的必要分辨率。通过分辨率决定单元结合计算的必要分辨率的差为规定值以内的字符区域而构成为1个层,根据各层中包含的各字符区域的必要分辨率决定每层的必要分辨率。然后通过分辨率变换单元将各层中包含的字符区域的字符的分辨率变换为所述决定的该层的必要分辨率。

    一种基于双树复小波变换的脱机手写体汉字认知方法

    公开(公告)号:CN105825220A

    公开(公告)日:2016-08-03

    申请号:CN201610153924.4

    申请日:2016-03-16

    IPC分类号: G06K9/52 G06K9/62

    摘要: 本发明公开了一种基于双树复小波变换的脱机手写体汉字认知方法,其特征是按照以下步骤进行:第一步骤是分析脱机手写体汉字笔划的认知需求;第二步骤是构建脱机手写体汉字的初始特征模型;第三步骤是构建脱机手写体汉字的候选子空间;第四步骤是设计脱机手写体汉字的集成分类器模型;第五步骤是对脱机手写体汉字样本的认知结果进行评价并根据评价结果对未认知的脱机手写体汉字进行反复认知。本发明在反馈迭代中构建特定测试样本的优化认知模型,解决了开环无反馈脱机手写体汉字识别系统认知模型固定的缺陷,提高了脱机手写体汉字识别系统的认知精度。

    区域识别方法及装置
    6.
    发明公开

    公开(公告)号:CN105528606A

    公开(公告)日:2016-04-27

    申请号:CN201510726153.9

    申请日:2015-10-30

    发明人: 龙飞 张涛 陈志军

    IPC分类号: G06K9/34 G06K9/46

    摘要: 本公开揭示了一种区域识别方法及装置,属于图像处理领域。所述区域识别方法包括:对文字区域进行二值化,得到二值化后的文字区域;该文字区域包括属于同一行的若干个文字;对二值化后的文字区域按照竖直方向计算直方图,该直方图包括:每列像素点的横坐标和每列像素点中前景色像素点的累加值;根据直方图中的累加值的分布信息,识别文字区域中的文字的字符区域。通过对二值化后的文字区域按照竖直方向计算直方图,根据直方图中的分布信息,识别文字区域中的文字的字符区域;解决了相关技术中文字区域定位准确度较低问题;达到了可以根据直方图中的前景色像素点的累加值的分布信息来精确定位文字的字符区域的效果。

    一种普适性的图像文字提取方法

    公开(公告)号:CN104978565A

    公开(公告)日:2015-10-14

    申请号:CN201510236463.2

    申请日:2015-05-11

    发明人: 郑海舟

    IPC分类号: G06K9/00 G06K9/46

    摘要: 本发明公开了一种普适性的图像文字提取方法,其包括以下步骤:对图像进行颜色空间转化;对图像进行颜色降维;对降维后的图像进行颜色直方图统计;根据颜色直方图计算图像的颜色复杂度,并根据颜色复杂度对图像划定分类;根据图像的颜色复杂度类别对原图像进行二值化处理。本发明能够对文本图像的背景复杂度进行评估,进而自动选择对应的二值化算法,适合对不同背景复杂度的图像进行文字提取。

    字符识别设备、方法和程序

    公开(公告)号:CN104685514A

    公开(公告)日:2015-06-03

    申请号:CN201380050494.8

    申请日:2013-09-19

    IPC分类号: G06K9/00 G06K9/62

    摘要: 根据一个实施例,字符识别设备包括第一生成单元、估算单元、第二生成单元和查找单元。该第一生成单元生成登记偏爱的字符的用户词典。该估算单元基于目标文本的布局和标记信息中的一个或多个估算字符之间的第一分离。该第二生成单元通过基于该第一分离估算由笔划表示的字符段来生成格子框架结构。如果该格子框架结构包括对应于该偏爱的字符的路径,则查找单元在该格子框架结构中查找路径以获得字符识别结果。