字符识别装置、字符识别方法及程序

    公开(公告)号:CN107949852A

    公开(公告)日:2018-04-20

    申请号:CN201680050583.6

    申请日:2016-09-01

    IPC分类号: G06K9/62 G06K9/03

    摘要: 实施方式的字符识别装置(10)具备:字符串图像取得部(11),取得字符串图像;结合图表生成部(12),对字符串图像进行字符识别处理,生成将多个表示被视为1个字符的每个字符区域的识别结果的字符候选信息、按照字符串图像中的各字符区域的排列顺序进行连接而得的结合图表,多个字符候选信息分别包含有1个以上候选字符;结合图表统合部(13),对根据包含有同一字符串的多个字符串图像生成的多个结合图表或者通过对1个字符串图像进行多个不同字符识别处理而生成的多个结合图表进行统合;以及输出部(15),输出统合后的结合图表或者基于统合后的结合图表而得到的识别字符串。

    一种脱机手写中文规范地址识别方法

    公开(公告)号:CN107133215A

    公开(公告)日:2017-09-05

    申请号:CN201710360137.1

    申请日:2017-05-20

    申请人: 复旦大学

    发明人: 刘谦 王丹青 路红

    IPC分类号: G06F17/27 G06K9/34 G06K9/62

    摘要: 本发明属于计算机图像处理的光学字符识别技术领域,具体是一种脱机手写中文规范地址识别方法。本发明方法首先根据地址库信息提取地址层次关系的关键字,之后通过地址的关键字划分字符串获得地址词语;针对地址词语,在单字识别的基础上利用地址信息库进行验证和纠错。本发明提出了一种结合特定领域知识进行手写汉字字符串识别的新方法,能够对手写汉字地址进行有效的识别,并提高识别的准确度。

    一种在线手写中日文的识别方法

    公开(公告)号:CN106570458A

    公开(公告)日:2017-04-19

    申请号:CN201610898064.7

    申请日:2016-10-14

    发明人: 刘建生

    IPC分类号: G06K9/00

    CPC分类号: G06K9/00402 G06K2209/011

    摘要: 本发明提供一种在线手写中日文识别方法。通过应用结构化字典表示(structured dictionary representation)和矢量量化(VQ)技术建立一种紧凑型的基于MRF在线字符识别方法,实现对大规模中日文字符集的识别。本发明将字符分解为组成字符的基本要素自由基,通过基于MRF的模型将组成不同字符的相同的自由基进行共享,节省了字典模型的存储空间。此外,本发明同时应用了VQ技术压缩字符识别器,可以在不损失识别率的同时,进一步大幅压缩字典模型的存储空间。

    一种基于OCR的票据自动识别与处理系统

    公开(公告)号:CN105528604A

    公开(公告)日:2016-04-27

    申请号:CN201610070970.8

    申请日:2016-01-31

    发明人: 高学 金连文

    IPC分类号: G06K9/32 G06K9/34

    摘要: 本发明提供一种基于OCR的票据自动识别与处理系统,包括图像采集模块、快速图像二值化模块、文本块检测与定位模块、单栏文本块的精确定位模块、多栏文本块的精确定位与分割模块、文本识别模块和票据图像检索模块。本发明不仅可以完成发票票据图像的高清采集与压缩存储,还能够对每张票据中的购销方信息、商品信息、开票日期等文字字符进行鲁棒、高精度地定位与识别。票据图像识别能够进行方便的检索。该系统具有处理与识别精度高、成本较低、鲁棒性好、自动化程度高等特点,可广泛应用于票据的计算机自动化管理中,如票据的认证、票据的归档和查询等。

    信息处理装置和图像修改方法

    公开(公告)号:CN105426810A

    公开(公告)日:2016-03-23

    申请号:CN201510570264.5

    申请日:2015-09-09

    IPC分类号: G06K9/00 G06K9/32 G06K9/34

    摘要: 根据实施例,信息处理装置包括获取单元、第一和第二分割单元、计算部、修改单元和输出单元。获取单元获取图像。第一分割单元将所述图像分割成为包含一个以上的字符的文本包含区域和除了所述文本包含区域之外的背景区域。第二分割单元将所述文本包含区域分割成为由形成所述字符的线所构成的字符区域和除了所述字符区域之外的字符背景区域。计算部计算所述字符区域的预定属性的第一代表值、所述字符背景区域的所述预定属性的第二代表值、和所述背景区域的所述预定属性的第三代表值。修改单元以基于第一代表值和第三代表值的第一差、基于第一代表值和第二代表值的第二差、以及基于第二代表值和第三代表值的第三差变大的方式,修改第一代表值、第二代表值和第三代表值中的至少一个。输出单元通过以下获得修改后的图像:当所述第一代表值被修改时,将所述字符区域的所述预定属性的值改变为修改后的第一代表值,当所述第二代表值被修改时,将所述字符背景区域的所述预定属性的值改变为修改后的第二代表值,或者当所述第三代表值被修改时,将所述背景区域的所述预定属性的值改变为修改后的第三代表值。

    字符分割方法和装置
    27.
    发明公开

    公开(公告)号:CN105095860A

    公开(公告)日:2015-11-25

    申请号:CN201510382075.5

    申请日:2015-06-30

    IPC分类号: G06K9/00

    摘要: 本公开是关于一种字符分割方法和装置,属于字符识别领域。方法包括:提取原始图像的字符区域,获取多种预设模板的特征向量,对于每种预设模板,选取多个初始位置,计算每个初始位置与预设模板的匹配分值,选取与预设模板的匹配分值最大的初始位置,作为优选初始位置;将优选初始位置与预设模板的匹配分值作为预设模板的指定匹配分值,将指定匹配分值与特征向量的维数之间的商作为优选匹配分值;选取优选匹配分值最大的预设模板,作为优选预设模板;根据优选预设模板的特征向量和优选预设模板对应的优选初始位置进行分割。本公开通过找出与字符框集合最为匹配的优选预设模板,提高了字符分割的准确率,进行字符识别时提高了识别准确率。

    一种面向碑文的汉字提取方法

    公开(公告)号:CN104992176A

    公开(公告)日:2015-10-21

    申请号:CN201510441259.4

    申请日:2015-07-24

    IPC分类号: G06K9/34 G06K9/46

    摘要: 本发明是一种面向碑文的汉字提取方法,主要包括基于Area Voronoi的汉字区域定位方法和基于连通域和包围盒的单字切分方法两个部分。首先针对碑文图像中汉字的分布规律和特点,获取图像中的连通域作为生成元,并利用Freeman编码链来表示每个连通域的轮廓。采用扩展轮廓边界的方法构建出图像的Area Voronoi图。然后根据连通域间的标准差,合并相邻的Area Voronoi区域,从而完成汉字区域的定位操作。在获取汉字区域图像之后,对其进行预处理,去除一定的噪声影响。通过归纳汉字的结构特点,将连通域分析法和包围盒交叠判断法二者相结合,对汉字进行单字提取。本发明针对古代碑文的排列规律,能够较好的完成单个汉字的提取工作,并具有一定的抗噪性。

    一种基于部件识别的汉字部件分割与结构判定方法

    公开(公告)号:CN104992161A

    公开(公告)日:2015-10-21

    申请号:CN201510424057.9

    申请日:2015-07-17

    IPC分类号: G06K9/00 G06K9/34

    摘要: 本发明公开了一种基于部件识别的汉字部件分割与结构判定方法,首先对特定字体的汉字部件图片进行处理完成汉字部件建模;其次,对输入汉字分解为各个笔段,对照库中每个部件得到一组相似性最大的笔段集合,同时通过最优组合策略得到输入汉字的部件识别结果,此外还得到输入汉字中检测出的初始笔段集合与对应部件的关系;然后,采用轮廓检测算法以及边缘跟踪算法,利用存储成链状形式的轮廓信息,寻找每个轮廓点与最近的骨架点的对应关系,完成对汉字部件的分割操作;最后,利用汉字构型的黄金格理论,准确的分析出部件的布局和汉字的结构,从而完成对汉字的结构判定和分类。本发明相比其它图像分割的方法,能够较好的对汉字部件进行分割和结构判定。

    应用于毛笔的书写轨迹采样方法和装置

    公开(公告)号:CN104978581A

    公开(公告)日:2015-10-14

    申请号:CN201510401737.9

    申请日:2015-07-09

    IPC分类号: G06K9/46

    CPC分类号: G06K9/4604 G06K2209/011

    摘要: 本发明提供了一种应用于毛笔的书写轨迹采样方法和装置。其中,该方法包括:从毛笔字笔画碑帖中提取笔画的样本;通过手写输入设备模仿的所述笔画的书写轨迹,读取手写输入设备按下书写至抬起停止书写过程中的书写轨迹数据;其中,所述书写轨迹数据包括各个书写点的坐标和时间;按照各个书写点的时间先后顺序和书写点的坐标确定所述书写轨迹数据的转折点;以确定的转折点为分隔点将所述书写轨迹数据分为多个笔画段;按照设定的采样方式和所述笔画的样本对所述多个笔画段的书写轨迹数据分别进行采样;将所述样本对应的采样数据记录在笔画样本库中。通过本发明,提升了笔画样本库的实用性。