倾斜文本检测模型训练方法和票证图像文本检测方法

    公开(公告)号:CN110135424A

    公开(公告)日:2019-08-16

    申请号:CN201910435630.4

    申请日:2019-05-23

    IPC分类号: G06K9/32 G06K9/62

    摘要: 本发明公开了一种倾斜文本检测模型训练方法和票证图像文本检测方法,该训练方法应用于包括第一网络单元、第二网络单元和第三网络单元的倾斜文本检测模型,其中,所述倾斜文本检测模型的文本训练,包括:将已标注的票证图像通过第一网络单元进行特征提取以获取特征图,并获取所述特征图中各像素点的水平候选框;对各水平候选框进行第一阶段回归并通过第二网络单元输出最小水平外接矩形建议框;将各最小水平外接建议框进行第二阶段回归。根据本发明的技术方案,可以实现对票证图像中的倾斜文本进行文本区域的检测,并且能在真实样本量不足时也能达到较高准确率,鲁棒性强等。

    表格式图片版面分析方法和计算机存储介质

    公开(公告)号:CN110147774A

    公开(公告)日:2019-08-20

    申请号:CN201910435629.1

    申请日:2019-05-23

    IPC分类号: G06K9/00 G06F17/24

    摘要: 本发明公开了一种表格式图片版面分析方法和计算机存储介质,该方法包括:获取该目标图片中的所有文本框图的信息,每一文本框图的信息包括文本框图的文本内容和对应的框图信息;将至少一预设标题字段与各文本框图的文本内容进行字符匹配以查找各预设标题字段的所在框图,并将该所在框图作为预设标题字段框图;根据各预设标题字段框图的框图位置信息按照预设规则确定与当前的预设标题字段相匹配的字段内容框图;获取所述字段内容框图的文本内容并输出至预设模板表格中。根据本发明的技术方案,可以实现表格版式图片的版面分析,识别准确率较高,鲁棒性好且易于扩展等。

    一种文字识别方法、装置、电子设备及存储介质

    公开(公告)号:CN112699875B

    公开(公告)日:2024-10-18

    申请号:CN202011628551.4

    申请日:2020-12-31

    IPC分类号: G06V30/14

    摘要: 本申请涉及一种文字识别方法、装置、电子设备及存储介质,所述文字识别方法包括:将待识别模糊图像分别输入训练好的各单模糊类型的文本识别模型,得到每个类型的文本识别模型对应的文字识别准确率;从多个文本识别模型中,选取文字识别准确率最高的文本识别模型作为第一模型,并获取第一模型在待识别模糊图像中识别错误的图像第一文本;基于对第一文本进行文字识别的准确数量,确定除第一模型之外的第二模型。本申请根据每个类型的文本识别模型对应的文字识别准确率,以及对文字识别错误样本中的文字识别的准确数量来确定综合识别模型,并通过综合识别模型来对待识别模糊图像进行文字识别,可以提高对模糊图像进行文字识别的准确率。

    倾斜文本方向分类方法、装置、终端设备和可读存储介质

    公开(公告)号:CN113936288A

    公开(公告)日:2022-01-14

    申请号:CN202111280859.9

    申请日:2021-11-01

    摘要: 本申请实施例提供一种倾斜文本方向分类方法、装置、终端设备和可读存储介质,该方法包括:将待检测图片输入已训练的倾斜文本检测模型,预测输出所述图片中文本所在区域的文本包围框信息,所述文本包围框信息包括用于包围相应文本串的旋转矩形的两个顶点坐标;选取预设比例数量的文本包围框,并根据所述旋转矩形的两个顶点的坐标按照包围框方向分类算法分别计算所述选取的各个文本包围框的文本方向分类结果;根据各个所述文本方向分类结果确定所述图片的最终文本方向分类。该方法避免了将文本方向判定作为独立功能模块实现,节省了方向分类任务相关的模型参数开销、训练开销、预测开销及后续计算开销等。

    一种图片识别方法及装置
    7.
    发明公开

    公开(公告)号:CN112381096A

    公开(公告)日:2021-02-19

    申请号:CN202011266787.8

    申请日:2020-11-12

    发明人: 李树凯 田强

    IPC分类号: G06K9/34

    摘要: 本申请实施例提供一种图片识别方法及装置,通过确认待分割图片的类型,其中,所述待分割图片的类型至少是通过分析所述待分割图片中的版式字段的特征得到的;根据所述待分割图片的类型,配置分割锚点,其中,所述分割锚点是基于所述待分割图片的共有字段中选择;根据所述分割锚点对所述待分割图片进行分割;提取分割图片中的图片信息;识别所述图片信息,能够准确识别纸质图片中的图片信息。

    一种文字识别方法、装置、电子设备及存储介质

    公开(公告)号:CN112699875A

    公开(公告)日:2021-04-23

    申请号:CN202011628551.4

    申请日:2020-12-31

    IPC分类号: G06K9/20

    摘要: 本申请涉及一种文字识别方法、装置、电子设备及存储介质,所述文字识别方法包括:将待识别模糊图像分别输入训练好的各单模糊类型的文本识别模型,得到每个类型的文本识别模型对应的文字识别准确率;从多个文本识别模型中,选取文字识别准确率最高的文本识别模型作为第一模型,并获取第一模型在待识别模糊图像中识别错误的图像第一文本;基于对第一文本进行文字识别的准确数量,确定除第一模型之外的第二模型。本申请根据每个类型的文本识别模型对应的文字识别准确率,以及对文字识别错误样本中的文字识别的准确数量来确定综合识别模型,并通过综合识别模型来对待识别模糊图像进行文字识别,可以提高对模糊图像进行文字识别的准确率。

    票证识别训练样本合成方法和计算机存储介质

    公开(公告)号:CN110163285A

    公开(公告)日:2019-08-23

    申请号:CN201910435628.7

    申请日:2019-05-23

    IPC分类号: G06K9/62 G06K9/00

    摘要: 本发明公开了一种票证识别训练样本合成方法和计算机存储介质,该方法包括:按照预设规则从语料库中进行字符采样,得到字符采样集合,并从所述字符采样集合中读取字符生成具有预定长度的样本字符串,将多个所述样本字符串组成样本字符串集合;对各样本字符串进行文字掩码预处理并生成对应的前景文字掩码图像;将各前景文字掩码图像与对应选取的票证背景图像进行二次图像融合,以得到用于票证识别的合成训练样本集合。根据本发明的技术方案,可以实现人工合成票证文本识别所需的训练样本,以用于替代真实样本来进行模型训练,进而还可以解决真实样本的样本数量不可控等难题。

    一种训练识别模型的方法、装置、设备和可读存储介质

    公开(公告)号:CN114693999A

    公开(公告)日:2022-07-01

    申请号:CN202210502256.7

    申请日:2022-05-09

    IPC分类号: G06V10/774 G06K9/62

    摘要: 本申请提供一种训练识别模型的方法、装置、设备和可读存储介质,该方法包括,获取预设种类的单证对应预设数量的基础样本图片和预设数量的特殊样本图片中的预设比例的特殊样本图片,其中基础样本图片为基础语料库中语料字段的截取图片,特殊样本图片中包含预设种类的单证中的同类型字段;基于预设数量的基础样本图片和预设数量的特殊样本图片中的预设比例的特殊样本图片对基础模型进行训练,得到用于单证图片识别的识别模型。在满足模型准确率的前提下,通过该方法可以达到节省训练模型的资源和训练时间的效果。