- 专利标题: 一种基于注意力机制的多源多尺度图像融合方法与装置
-
申请号: CN202410219239.1申请日: 2024-02-28
-
公开(公告)号: CN118014860B公开(公告)日: 2024-07-23
- 发明人: 刘晶晶 , 张建华 , 郭爱英 , 张立
- 申请人: 上海大学
- 申请人地址: 上海市宝山区上海市上大路99号
- 专利权人: 上海大学
- 当前专利权人: 上海大学
- 当前专利权人地址: 上海市宝山区上海市上大路99号
- 代理机构: 合肥集知匠心知识产权代理事务所
- 代理商 张涛
- 主分类号: G06T5/50
- IPC分类号: G06T5/50 ; G06T5/60 ; G06T5/70 ; G06V10/42 ; G06V10/44 ; G06V10/52 ; G06V10/774 ; G06V10/80 ; G06V10/82 ; G06V20/70 ; G06N3/0455 ; G06N3/0464 ; G06N3/084
摘要:
本发明属于计算机视觉技术领域,具体公开提供的一种基于注意力机制的多源多尺度图像融合方法与装置。该方法包括:导入不同尺度下收集待融合的图像,并进行预处理,组合成多源图像对;提取多源图像对的全局特征提取;搭建多尺度图像融合网络结构;设置目标掩膜,进行全局特征信息进行标注;设置训练损失函数;进行多源图像对的图像融合训练,并输出融合图像;本发明有效解决了当前场景适应不足的问题,提高了全局特征表示的能力。此外,通过全局特征标注,提高融合图像中红外图像中重要信息的保留比例和可见光图像中背景纹理的保留比例,并且在掩模的基础上设计了内容损失来指导特征提取,实现更好的多源图像融合。
公开/授权文献
- CN118014860A 一种基于注意力机制的多源多尺度图像融合方法与装置 公开/授权日:2024-05-10