一种基于图像增强的自然场景文本识别方法

    公开(公告)号:CN111428718A

    公开(公告)日:2020-07-17

    申请号:CN202010240272.4

    申请日:2020-03-30

    Applicant: 南京大学

    Inventor: 钱烨 王雨阳 苏丰

    Abstract: 本发明公开一种基于图像增强的自然场景文本识别方法,包括以下步骤:(1)构建包含增强网络和识别网络的自然场景文本识别模型;(2)训练基于图像增强的自然场景文本识别模型;(3)对一幅待识别的自然场景文本图像,将其输入到训练完成的识别模型,依次通过模型中的增强网络和识别网络后,模型的输出即为从该图像中识别获得的文字字符序列。本发明通过在文本识别模型中的识别网络模块前引入专门的图像增强模块,并端到端地对整个识别模型进行训练,使得所引入图像增强模块能够自适应地对输入图像进行调整和增强,例如抑制复杂背景、突出文本区域等,从而改善图像的质量,有效提高后继文本识别网络模块的准确率。

    一种基于图像增强的自然场景文本识别方法

    公开(公告)号:CN111428718B

    公开(公告)日:2023-05-09

    申请号:CN202010240272.4

    申请日:2020-03-30

    Applicant: 南京大学

    Inventor: 钱烨 王雨阳 苏丰

    Abstract: 本发明公开一种基于图像增强的自然场景文本识别方法,包括以下步骤:(1)构建包含增强网络和识别网络的自然场景文本识别模型;(2)训练基于图像增强的自然场景文本识别模型;(3)对一幅待识别的自然场景文本图像,将其输入到训练完成的识别模型,依次通过模型中的增强网络和识别网络后,模型的输出即为从该图像中识别获得的文字字符序列。本发明通过在文本识别模型中的识别网络模块前引入专门的图像增强模块,并端到端地对整个识别模型进行训练,使得所引入图像增强模块能够自适应地对输入图像进行调整和增强,例如抑制复杂背景、突出文本区域等,从而改善图像的质量,有效提高后继文本识别网络模块的准确率。

Patent Agency Ranking