一种任意方向自然场景文本识别方法

    公开(公告)号:CN111242113B

    公开(公告)日:2022-07-08

    申请号:CN202010017936.0

    申请日:2020-01-08

    Inventor: 景小荣 朱莉

    Abstract: 本发明涉及一种任意方向自然场景文本识别方法,属于数字图像处理领域,包括以下步骤:S1:首先使用高分辨分割网络HRNet作为基础框架提取文本的空间信息;S2:然后使用卷积长短时记忆ConvLSTM模型提取文本的时空序列信息;S3:通过设计字符注意机制使得模型的注意力在字符上,并使用可微分二值化函数进一步加大网络对前景的注意力,而削弱对背景区域的关注;S4:网络对每个像素点进行37分类,将分类结果按照从左到右的顺序转换成文本。本发明能识别任意方向的场景文本,同时对低分辨率和强噪声文本均有较强的鲁棒性。

    基于回归的多尺度场景文本检测方法

    公开(公告)号:CN110533041B

    公开(公告)日:2022-07-01

    申请号:CN201910838235.0

    申请日:2019-09-05

    Inventor: 景小荣 朱莉

    Abstract: 本发明涉及基于回归的多尺度场景文本检测方法,属于数字图像处理领域。该方法具体包括:S1:设置充足的具有文本位置标定的训练数据;S2:构建特征提取网络,包括自低向上的前向网络过程和自顶向下的特征融合过程,用于提取出各训练数据的低中高层特征;S3:对送入检测层的各层特征使用级联模块;S4:采用基于回归的检测框架,根据文本特征设置合适的默认框,检测图像中的文本位置。本发明采用的级联模块提高了网络的感受野,使得设置的文本特征的默认框十分合适,最终准确的检测到图像中的文本位置。

    一种任意方向自然场景文本识别方法

    公开(公告)号:CN111242113A

    公开(公告)日:2020-06-05

    申请号:CN202010017936.0

    申请日:2020-01-08

    Inventor: 景小荣 朱莉

    Abstract: 本发明涉及一种任意方向自然场景文本识别方法,属于数字图像处理领域,包括以下步骤:S1:首先使用高分辨分割网络HRNet作为基础框架提取文本的空间信息;S2:然后使用卷积长短时记忆ConvLSTM模型提取文本的时空序列信息;S3:通过设计字符注意机制使得模型的注意力在字符上,并使用可微分二值化函数进一步加大网络对前景的注意力,而削弱对背景区域的关注;S4:网络对每个像素点进行37分类,将分类结果按照从左到右的顺序转换成文本。本发明能识别任意方向的场景文本,同时对低分辨率和强噪声文本均有较强的鲁棒性。

    基于回归的多尺度场景文本检测方法

    公开(公告)号:CN110533041A

    公开(公告)日:2019-12-03

    申请号:CN201910838235.0

    申请日:2019-09-05

    Inventor: 景小荣 朱莉

    Abstract: 本发明涉及基于回归的多尺度场景文本检测方法,属于数字图像处理领域。该方法具体包括:S1:设置充足的具有文本位置标定的训练数据;S2:构建特征提取网络,包括自低向上的前向网络过程和自顶向下的特征融合过程,用于提取出各训练数据的低中高层特征;S3:对送入检测层的各层特征使用级联模块;S4:采用基于回归的检测框架,根据文本特征设置合适的默认框,检测图像中的文本位置。本发明采用的级联模块提高了网络的感受野,使得设置的文本特征的默认框十分合适,最终准确的检测到图像中的文本位置。

Patent Agency Ranking