-
公开(公告)号:CN113378815B
公开(公告)日:2023-11-24
申请号:CN202110666699.5
申请日:2021-06-16
Applicant: 南京信息工程大学
IPC: G06V30/14 , G06V30/18 , G06V30/19 , G06N3/0464 , G06V10/82 , G06N3/0895
Abstract: 本发明公开了一种场景文本定位识别的模型及其训练和识别的方法,属于计算机技术领域。其包括定位器、分组模块和识别器,所述定位器和识别器通过分组模块连接;所述定位器输出的是字符框、字符连接框和文本框,所述字符框和字符连接框定位文本的位置,所述分组模块根据字符框和文本框将字符图片裁剪,分组送入到所述识别器当中,所述识别器输出各组的识别结果,最后根据定位和识别结果完成场景文本的定位与识别;本发明能够使计算机准确高效地完成检测识别自然场景中文本的任务。
-
公开(公告)号:CN113903023A
公开(公告)日:2022-01-07
申请号:CN202111142163.X
申请日:2021-09-28
Applicant: 南京信息工程大学
IPC: G06V20/62 , G06V10/25 , G06V10/82 , G06V30/19 , G06V10/44 , G06V10/40 , G06V30/414 , G06K9/62 , G06T7/12 , G06T7/62 , G06N3/04
Abstract: 本发明公开了一种基于改进MaskRCNN与SEED框架的自然场景文字检测识别方法,该方法将CV领域常用的实例分割算法Mask‑RCNN进行改进并用于自然场景中的文字定位,将其输出结果(蒙版Mask、边框Box)通过进一步的RoI Masking操作增强图像文字部分信息,然后与用于场景文字的语义增强的编码器‑解码器框架SEED组合完成精确度较高的自然场景文字检测与识别。本发明所述方法能够显著降低对训练过程中所需数据集的要求,对文字定位精确至字符轮廓,得到的文字识别精确度高。
-
公开(公告)号:CN113378815A
公开(公告)日:2021-09-10
申请号:CN202110666699.5
申请日:2021-06-16
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种场景文本定位识别的模型及其训练和识别的方法,属于计算机技术领域。其包括定位器、分组模块和识别器,所述定位器和识别器通过分组模块连接;所述定位器输出的是字符框、字符连接框和文本框,所述字符框和字符连接框定位文本的位置,所述分组模块根据字符框和文本框将字符图片裁剪,分组送入到所述识别器当中,所述识别器输出各组的识别结果,最后根据定位和识别结果完成场景文本的定位与识别;本发明能够使计算机准确高效地完成检测识别自然场景中文本的任务。
-
公开(公告)号:CN114255464B
公开(公告)日:2025-03-25
申请号:CN202111530794.9
申请日:2021-12-14
Applicant: 南京信息工程大学
IPC: G06V20/62 , G06V30/146 , G06V30/148 , G06V30/19 , G06N3/0464 , G06N3/045 , G06N3/084
Abstract: 本发明公开了基于CRAFT和SCRN‑SEED框架的自然场景文字检测识别方法,包括如下步骤:(1)利用真实数据集和合成数据集建立图像数据集,将图像数据集分为训练集和测试集;(2)利用图像数据集训练CRAFT网络;(3)利用真实数据集训练不规则文本纠正网络SCRN;(4)将SCRN与SEED网络结合,训练结合后的SCRN‑SEED网络;(5)将CRAFT网络与SCRN‑SEED网络连接,构建完整的模型并进行训练。本发明能够充分检测弯曲变形文本或长篇文本实例,通过精确地定位每一个字符,然后再把检测到的字符通过亲和力机制连接成一个文本达到检测的目的,对于弯曲、变形或者极长的文本都适用;通过不规则文本图片的矫正以及将语义信息用于全局信息的检测,能够精确的识别低质量的文本实例。
-
公开(公告)号:CN113903023B
公开(公告)日:2024-07-02
申请号:CN202111142163.X
申请日:2021-09-28
Applicant: 南京信息工程大学
IPC: G06V20/62 , G06V10/25 , G06V10/82 , G06V30/19 , G06V10/44 , G06V10/40 , G06V30/414 , G06T7/12 , G06T7/62 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06N3/044 , G06N3/084
Abstract: 本发明公开了一种基于改进MaskRCNN与SEED框架的自然场景文字检测识别方法,该方法将CV领域常用的实例分割算法Mask‑RCNN进行改进并用于自然场景中的文字定位,将其输出结果(蒙版Mask、边框Box)通过进一步的RoI Masking操作增强图像文字部分信息,然后与用于场景文字的语义增强的编码器‑解码器框架SEED组合完成精确度较高的自然场景文字检测与识别。本发明所述方法能够显著降低对训练过程中所需数据集的要求,对文字定位精确至字符轮廓,得到的文字识别精确度高。
-
公开(公告)号:CN114255464A
公开(公告)日:2022-03-29
申请号:CN202111530794.9
申请日:2021-12-14
Applicant: 南京信息工程大学
IPC: G06V30/146 , G06V30/148 , G06K9/62 , G06N3/04 , G06N3/08 , G06V20/62
Abstract: 本发明公开了基于CRAFT和SCRN‑SEED框架的自然场景文字检测识别方法,包括如下步骤:(1)利用真实数据集和合成数据集建立图像数据集,将图像数据集分为训练集和测试集;(2)利用图像数据集训练CRAFT网络;(3)利用真实数据集训练不规则文本纠正网络SCRN;(4)将SCRN与SEED网络结合,训练结合后的SCRN‑SEED网络;(5)将CRAFT网络与SCRN‑SEED网络连接,构建完整的模型并进行训练。本发明能够充分检测弯曲变形文本或长篇文本实例,通过精确地定位每一个字符,然后再把检测到的字符通过亲和力机制连接成一个文本达到检测的目的,对于弯曲、变形或者极长的文本都适用;通过不规则文本图片的矫正以及将语义信息用于全局信息的检测,能够精确的识别低质量的文本实例。
-
-
-
-
-