一种自然场景任意形状文本检测方法、装置和训练方法

    公开(公告)号:CN113591719B

    公开(公告)日:2024-05-28

    申请号:CN202110879151.9

    申请日:2021-08-02

    Applicant: 南京大学

    Abstract: 本文明公开了一种自然场景任意形状文本检测方法、装置和训练方法,所述检测方法包括如下步骤:获取含任意形状文本区域的自然场景图像并进行预处理;对预处理后图像提取多尺度特征图,并进行多尺度特征融合得到多尺度融合特征图,通过多尺度融合特征图卷积得到候选文本边界框,根据候选文本边界框得到文本实例分割图;对所述文本实例分割图做阈值筛选和连通域分析,得到文本边界框作为最终检测结果。本发明方法提高了自然场景任意形状文本检测的鲁棒性和准确性。

    一种基于上下边界提取的自然场景下文字检测方法

    公开(公告)号:CN112861860B

    公开(公告)日:2024-04-19

    申请号:CN202110265373.1

    申请日:2021-03-11

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于上下边界提取的自然场景下文字检测方法,涉及计算机视觉文字检测和图像分割领域。具体包括:步骤1,通过卷积神经网络模型提取图像的特征图,并通过多尺度特征金字塔模型对特征图进行增强;步骤2,通过语义分割模型预测文字的中心区域,上边界区域,下边界区域和文字的整体区域;步骤3,通过广度优先搜索将中心区域逐步扩展至整体区域,同时通过对上下边界区域进行滤波操作得到文字的形式化上下边界线;步骤4,组合文字的中心区域、整体区域以及上下边界线得到最终的文字检测结果。优点在于能够提取图像中文字的上下边界并定位文字区域,能够进行自然场景下的图像文字检测。

    一种基于上下边界提取的自然场景下文字检测方法

    公开(公告)号:CN112861860A

    公开(公告)日:2021-05-28

    申请号:CN202110265373.1

    申请日:2021-03-11

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于上下边界提取的自然场景下文字检测方法,涉及计算机视觉文字检测和图像分割领域。具体包括:步骤1,通过卷积神经网络模型提取图像的特征图,并通过多尺度特征金字塔模型对特征图进行增强;步骤2,通过语义分割模型预测文字的中心区域,上边界区域,下边界区域和文字的整体区域;步骤3,通过广度优先搜索将中心区域逐步扩展至整体区域,同时通过对上下边界区域进行滤波操作得到文字的形式化上下边界线;步骤4,组合文字的中心区域、整体区域以及上下边界线得到最终的文字检测结果。优点在于能够提取图像中文字的上下边界并定位文字区域,能够进行自然场景下的图像文字检测。

    一种自然场景任意形状文本检测方法、装置和训练方法

    公开(公告)号:CN113591719A

    公开(公告)日:2021-11-02

    申请号:CN202110879151.9

    申请日:2021-08-02

    Applicant: 南京大学

    Abstract: 本文明公开了一种自然场景任意形状文本检测方法、装置和训练方法,所述检测方法包括如下步骤:获取含任意形状文本区域的自然场景图像并进行预处理;对预处理后图像提取多尺度特征图,并进行多尺度特征融合得到多尺度融合特征图,通过多尺度融合特征图卷积得到候选文本边界框,根据候选文本边界框得到文本实例分割图;对所述文本实例分割图做阈值筛选和连通域分析,得到文本边界框作为最终检测结果。本发明方法提高了自然场景任意形状文本检测的鲁棒性和准确性。

Patent Agency Ranking