表格式图片版面分析方法和计算机存储介质

    公开(公告)号:CN110147774B

    公开(公告)日:2021-06-15

    申请号:CN201910435629.1

    申请日:2019-05-23

    IPC分类号: G06K9/00 G06F40/174

    摘要: 本发明公开了一种表格式图片版面分析方法和计算机存储介质,该方法包括:获取该目标图片中的所有文本框图的信息,每一文本框图的信息包括文本框图的文本内容和对应的框图信息;将至少一预设标题字段与各文本框图的文本内容进行字符匹配以查找各预设标题字段的所在框图,并将该所在框图作为预设标题字段框图;根据各预设标题字段框图的框图位置信息按照预设规则确定与当前的预设标题字段相匹配的字段内容框图;获取所述字段内容框图的文本内容并输出至预设模板表格中。根据本发明的技术方案,可以实现表格版式图片的版面分析,识别准确率较高,鲁棒性好且易于扩展等。

    倾斜文本检测模型训练方法和票证图像文本检测方法

    公开(公告)号:CN110135424B

    公开(公告)日:2021-06-11

    申请号:CN201910435630.4

    申请日:2019-05-23

    IPC分类号: G06K9/32 G06K9/62

    摘要: 本发明公开了一种倾斜文本检测模型训练方法和票证图像文本检测方法,该训练方法应用于包括第一网络单元、第二网络单元和第三网络单元的倾斜文本检测模型,其中,所述倾斜文本检测模型的文本训练,包括:将已标注的票证图像通过第一网络单元进行特征提取以获取特征图,并获取所述特征图中各像素点的水平候选框;对各水平候选框进行第一阶段回归并通过第二网络单元输出最小水平外接矩形建议框;将各最小水平外接建议框进行第二阶段回归。根据本发明的技术方案,可以实现对票证图像中的倾斜文本进行文本区域的检测,并且能在真实样本量不足时也能达到较高准确率,鲁棒性强等。

    一种凸字体银行卡号图像的合成方法、识别方法及装置

    公开(公告)号:CN112598611A

    公开(公告)日:2021-04-02

    申请号:CN202011493350.8

    申请日:2020-12-16

    IPC分类号: G06T5/50 G06K9/20

    摘要: 本申请提供了一种凸字体银行卡号图像的合成方法、识别方法及装置,涉及图像合成技术领域。该方法包括:获取待合成的非凸字体银行卡号图像所需的资源文件,资源文件包括银行卡卡号背景图像、银行卡卡号的排列规则信息和银行卡卡号的字体。基于资源文件和非凸字体银行卡图像合成算法合成非凸字体银行卡号图像,并输入到训练好的环形生成式对抗网络模型中,合成每个非凸字体银行卡号图像对应的凸字体银行卡号图像,采取上述方法得到的合成的凸字体银行卡号图像纹理质量较高,因此,采用这种合成的凸字体银行卡号图像进行识别模型的训练,可以提高识别模型识别银行卡号的准确率。

    票证识别训练样本合成方法和计算机存储介质

    公开(公告)号:CN110163285B

    公开(公告)日:2021-03-02

    申请号:CN201910435628.7

    申请日:2019-05-23

    IPC分类号: G06K9/62 G06K9/00

    摘要: 本发明公开了一种票证识别训练样本合成方法和计算机存储介质,该方法包括:按照预设规则从语料库中进行字符采样,得到字符采样集合,并从所述字符采样集合中读取字符生成具有预定长度的样本字符串,将多个所述样本字符串组成样本字符串集合;对各样本字符串进行文字掩码预处理并生成对应的前景文字掩码图像;将各前景文字掩码图像与对应选取的票证背景图像进行二次图像融合,以得到用于票证识别的合成训练样本集合。根据本发明的技术方案,可以实现人工合成票证文本识别所需的训练样本,以用于替代真实样本来进行模型训练,进而还可以解决真实样本的样本数量不可控等难题。

    保险单识别方法、装置以及计算机设备

    公开(公告)号:CN111666868A

    公开(公告)日:2020-09-15

    申请号:CN202010493630.2

    申请日:2020-06-03

    摘要: 本申请提供了一种保险单识别方法、装置以及计算机设备,涉及保险单识别技术领域,缓解了对于多种不同类型的保险单版面,保险单识别的准确度较低的技术问题。该方法包括:基于待识别保险单图像通过训练后的文本检测和识别模型得到所述待识别保险单图像中的保险单数据;将所述保险单数据中的字符与预设保险单类别关键字符进行匹配,根据匹配结果确定所述待识别保险单图像所属的保险单类型;基于所述保险单类型对应的预设标题字段匹配所述保险单识别数据,得到待识别保险单预设标题字段识别结果,匹配所有预设标题字段,最终得到整个保险单图像的识别结果。