-
公开(公告)号:CN118350992A
公开(公告)日:2024-07-16
申请号:CN202410516234.5
申请日:2024-04-28
申请人: 上海工程技术大学
IPC分类号: G06T3/4038 , G06T3/18 , G06T3/4046 , G06T5/50 , G06T5/60 , G06N3/045 , G06N3/0464 , G06N3/084
摘要: 本发明涉及一种基于ConvNeXt的拼接图像矩形化网络。该网络针对在训练过程中往往存在不同类型(输入样本及其掩膜图)的输入图像,从而导致训练效果不佳问题,提出了利用混合注意力机制使网络对输入样本中的空间域和通道域的特征呈现不同的关注度,提升了网络的特征学习能力。同时,为使得网络尽可能提取不同尺度目标的特征,利用了空洞空间金字塔池化模块,在扩大网络感受野的同时,对不同尺度的高维特征进行融合。与现有技术相比,本发明可以有效地提高矩形化效果,并且在面对复杂非线性语义信息的拼接图像时,拥有更好的语义内容保护能力。