-
公开(公告)号:CN111444919B
公开(公告)日:2023-07-04
申请号:CN202010305563.7
申请日:2020-04-17
Applicant: 南京大学
IPC: G06V20/62 , G06V30/148 , G06V30/19 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/09 , G06T3/40 , G06T3/60
Abstract: 本发明提供了一种自然场景中的任意形状文本检测方法,包括如下步骤:步骤1,对文本图片数据集中的训练图片进行预处理;步骤2,搭建分割网络,利用所述网络完成对训练图片的特征提取、分割预测,得到文本区域和文本中心区域的预测;步骤3,利用一种随着训练过程渐进衰减的权重来控制损失函数的计算,对网络进行监督训练得到检测器模型;步骤4,对待检测图片进行检测;步骤5,通过后处理算法得到文本中心核的预测图,过滤部分错误预测区域,然后直接扩张预测文本中心核得到最终检测结果。
-
公开(公告)号:CN111444919A
公开(公告)日:2020-07-24
申请号:CN202010305563.7
申请日:2020-04-17
Applicant: 南京大学
Abstract: 本发明提供了一种自然场景中的任意形状文本检测方法,包括如下步骤:步骤1,对文本图片数据集中的训练图片进行预处理;步骤2,搭建分割网络,利用所述网络完成对训练图片的特征提取、分割预测,得到文本区域和文本中心区域的预测;步骤3,利用一种随着训练过程渐进衰减的权重来控制损失函数的计算,对网络进行监督训练得到检测器模型;步骤4,对待检测图片进行检测;步骤5,通过后处理算法得到文本中心核的预测图,过滤部分错误预测区域,然后直接扩张预测文本中心核得到最终检测结果。
-