-
公开(公告)号:CN119992528A
公开(公告)日:2025-05-13
申请号:CN202510058141.7
申请日:2025-01-14
Applicant: 北京环境特性研究所
IPC: G06V20/62 , G06V30/19 , G06V30/18 , G06V10/52 , G06V10/764 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种场景文本检测方法及装置,属于计算机领域。该方法包括:利用多尺度骨干网络模块,对待检测图像进行多尺度特征提取,以得到多尺度特征图;基于多尺度特征图,构建初始的特征金字塔;利用特征金字塔增强网络模块,对初始的特征金字塔进行两阶段特征增强处理以得到增强后的特征图,两阶段包括自上而下特征增强阶段以及自下而上特征增强阶段,且每个阶段包括分组混洗卷积操作;利用双重注意力模块,对增强后的特征图进行跨尺度特征融合,以得到多尺度融合特征图;利用检测网络模块,对多尺度融合特征图进行场景文本检测,以得到场景文本检测结果。通过以上方法,能够在改善场景文本检测效果的同时,提高场景文本检测的实时性。