-
公开(公告)号:CN117253222A
公开(公告)日:2023-12-19
申请号:CN202311245057.3
申请日:2023-09-26
申请人: 湖南师范大学
IPC分类号: G06V20/62 , G06V30/148 , G06V30/18 , G06V30/19 , G06V10/44 , G06V10/80 , G06N3/0464 , G06N3/08
摘要: 本发明公开了基于多级信息融合机制的自然场景文本检测方法和装置,涉及计算机与人工智能领域,其中方法包括:利用主干网络对图像的特征进行提取,并对提取的所述特征进行多模块级联特征增强处理,得到含有图像全局上下文注意力信息和语义分割信息的融合特征图;根据所述融合特征图,利用Faster RCNN网络得到含有分类得分数值和回归参数的候选框;根据所述候选框的中心坐标与目标文本边界标注框中心线区域的关系对所述候选框进行初步筛选,得到文本候选框;根据所述分类得分数值,通过计算得到所述文本候选框的综合数值;根据所述综合数值,对所述文本候选框进行筛选得到检测结果;本发明利用上述方法对图像进行文本检测,提高了文本检测的精确度。