一种基于注意力融合的改进文本检测方法

    公开(公告)号:CN118135580A

    公开(公告)日:2024-06-04

    申请号:CN202410167186.3

    申请日:2024-02-06

    Inventor: 高光勇 薛冀杰

    Abstract: 本发明公开了一种基于注意力融合的改进文本检测方法,包括:采用特征金字塔网络作为骨干网络提取特征图;改变骨干网络中不同特征图之间的级联方式获取包含不同层次语义信息的特征图;引入融合注意力模块,自适应调整不同特征的权重分配,得到新特征图;利用自适应的二值化方法将所得新特征图转化为二值化的文本区域图;使用vatti裁剪算法剪裁文本区域,得到最终的文本检测结果。本发明将改进的文本特征提取方式和融合注意力模块与基于语义分割的文本检测网络DBnet结合,提升了文本检测的精度和鲁棒性。

    一种基于多尺度特征融合的场景文本检测方法

    公开(公告)号:CN118072331A

    公开(公告)日:2024-05-24

    申请号:CN202410285092.6

    申请日:2024-03-13

    Abstract: 本发明提供一种多尺度特征融合的场景文本检测方法,包括构建文本数据集,结合空洞卷积池化模块构建特征提取网络、结合多尺度特征融合模块构建多尺度特征融合网络、以及构建文本检测头网络、最后上述三个网络构建多尺度特征融合文本检测网络,以文本检测数据集训练多尺度特征融合场景文本检测网络得到多尺度特征融合文本检测模型,之后利用所述模型对采集的文本图片检测,获得识别结果。本发明可以进行跨层级的多尺度特征自适应融合,能够有效的缓解特征金字塔特征提取过程中的特征不对齐以及特征提取不充分的问题,并且更加充分的利用图像中的特征信息,尤其是对于小型文本和模糊文本的检测。

Patent Agency Ranking