一种基于图像增强的自然场景文本识别方法

    公开(公告)号:CN111428718B

    公开(公告)日:2023-05-09

    申请号:CN202010240272.4

    申请日:2020-03-30

    Applicant: 南京大学

    Inventor: 钱烨 王雨阳 苏丰

    Abstract: 本发明公开一种基于图像增强的自然场景文本识别方法,包括以下步骤:(1)构建包含增强网络和识别网络的自然场景文本识别模型;(2)训练基于图像增强的自然场景文本识别模型;(3)对一幅待识别的自然场景文本图像,将其输入到训练完成的识别模型,依次通过模型中的增强网络和识别网络后,模型的输出即为从该图像中识别获得的文字字符序列。本发明通过在文本识别模型中的识别网络模块前引入专门的图像增强模块,并端到端地对整个识别模型进行训练,使得所引入图像增强模块能够自适应地对输入图像进行调整和增强,例如抑制复杂背景、突出文本区域等,从而改善图像的质量,有效提高后继文本识别网络模块的准确率。

    一种基于多层次文本组件定位与生长的文本区域提取方法

    公开(公告)号:CN109460763B

    公开(公告)日:2022-06-21

    申请号:CN201811267160.7

    申请日:2018-10-29

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于多层次文本组件定位与生长的自然场景图像中文本区域提取方法,首先输入灰度或彩色RGB图像;在输入图像上运行MSER算法,进而以MSER边界作为区域边缘在MSER中运行SWT算法,获取极值区域内部像素的笔画宽度值;在极值区域中计算笔画宽度直方图,选取直方图中包含最多像素数量的三个笔画宽度对应的像素集合,并将通过边缘梯度差角特征验证的像素集合中的像素作为种子像素;基于种子像素,迭代进行字符内、字符间两个层次的生长过程,进一步基于多种文本区域特征对生长后获得的区域进行过滤,并将最终得到的文本区域作为结果输出。本发明提出的文本区域提取方法能够兼顾提取结果的精度和召回率,同时不依赖于特定机器学习模型,简单易重现。

    一种基于图像增强的自然场景文本识别方法

    公开(公告)号:CN111428718A

    公开(公告)日:2020-07-17

    申请号:CN202010240272.4

    申请日:2020-03-30

    Applicant: 南京大学

    Inventor: 钱烨 王雨阳 苏丰

    Abstract: 本发明公开一种基于图像增强的自然场景文本识别方法,包括以下步骤:(1)构建包含增强网络和识别网络的自然场景文本识别模型;(2)训练基于图像增强的自然场景文本识别模型;(3)对一幅待识别的自然场景文本图像,将其输入到训练完成的识别模型,依次通过模型中的增强网络和识别网络后,模型的输出即为从该图像中识别获得的文字字符序列。本发明通过在文本识别模型中的识别网络模块前引入专门的图像增强模块,并端到端地对整个识别模型进行训练,使得所引入图像增强模块能够自适应地对输入图像进行调整和增强,例如抑制复杂背景、突出文本区域等,从而改善图像的质量,有效提高后继文本识别网络模块的准确率。

    一种基于条件生成对抗网络的文本图像超分辨率重建方法

    公开(公告)号:CN109410239B

    公开(公告)日:2021-11-16

    申请号:CN201811320070.X

    申请日:2018-11-07

    Applicant: 南京大学

    Inventor: 王雨阳 苏丰

    Abstract: 本发明公开了一种基于条件生成对抗网络的文本图像超分辨率重建方法。该方法修改了普通的条件生成对抗网络的结构,使其更加适应于文本图像的超分辨率重建任务,另外引入并利用了文本‑非文本二值分割图像作为超分辨率重建模型的额外训练监督信息,并结合文本‑非文本二值分割信息构造模型的损失函数以约束模型的训练,使得超分辨率重建模型更加集中于图像中的文本部分。相比一般图像超分辨率方法,本发明公开的文本图像超分辨率重建方法更加充分和针对性地利用了文本自身信息,有效提高了文本图像超分辨率重建的质量。

    一种基于多层次文本组件定位与生长的文本区域提取方法

    公开(公告)号:CN109460763A

    公开(公告)日:2019-03-12

    申请号:CN201811267160.7

    申请日:2018-10-29

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于多层次文本组件定位与生长的自然场景图像中文本区域提取方法,首先输入灰度或彩色RGB图像;在输入图像上运行MSER算法,进而以MSER边界作为区域边缘在MSER中运行SWT算法,获取极值区域内部像素的笔画宽度值;在极值区域中计算笔画宽度直方图,选取直方图中包含最多像素数量的三个笔画宽度对应的像素集合,并将通过边缘梯度差角特征验证的像素集合中的像素作为种子像素;基于种子像素,迭代进行字符内、字符间两个层次的生长过程,进一步基于多种文本区域特征对生长后获得的区域进行过滤,并将最终得到的文本区域作为结果输出。本发明提出的文本区域提取方法能够兼顾提取结果的精度和召回率,同时不依赖于特定机器学习模型,简单易重现。

    一种基于条件生成对抗网络的文本图像超分辨率重建方法

    公开(公告)号:CN109410239A

    公开(公告)日:2019-03-01

    申请号:CN201811320070.X

    申请日:2018-11-07

    Applicant: 南京大学

    Inventor: 王雨阳 苏丰

    Abstract: 本发明公开了一种基于条件生成对抗网络的文本图像超分辨率重建方法。该方法修改了普通的条件生成对抗网络的结构,使其更加适应于文本图像的超分辨率重建任务,另外引入并利用了文本-非文本二值分割图像作为超分辨率重建模型的额外训练监督信息,并结合文本-非文本二值分割信息构造模型的损失函数以约束模型的训练,使得超分辨率重建模型更加集中于图像中的文本部分。相比一般图像超分辨率方法,本发明公开的文本图像超分辨率重建方法更加充分和针对性地利用了文本自身信息,有效提高了文本图像超分辨率重建的质量。

Patent Agency Ranking