一种基于多尺度特征融合的场景文本检测方法

    公开(公告)号:CN118072331A

    公开(公告)日:2024-05-24

    申请号:CN202410285092.6

    申请日:2024-03-13

    Abstract: 本发明提供一种多尺度特征融合的场景文本检测方法,包括构建文本数据集,结合空洞卷积池化模块构建特征提取网络、结合多尺度特征融合模块构建多尺度特征融合网络、以及构建文本检测头网络、最后上述三个网络构建多尺度特征融合文本检测网络,以文本检测数据集训练多尺度特征融合场景文本检测网络得到多尺度特征融合文本检测模型,之后利用所述模型对采集的文本图片检测,获得识别结果。本发明可以进行跨层级的多尺度特征自适应融合,能够有效的缓解特征金字塔特征提取过程中的特征不对齐以及特征提取不充分的问题,并且更加充分的利用图像中的特征信息,尤其是对于小型文本和模糊文本的检测。

Patent Agency Ranking