一种从PATCH到REGION架构的大幅面遥感影像语义分割方法

    公开(公告)号:CN116310325A

    公开(公告)日:2023-06-23

    申请号:CN202310173080.X

    申请日:2023-02-23

    Abstract: 本发明针对高分辨率遥感影像单次处理区域小、分割性能受限制等问题,设计了一种从PATCH到REGION架构的大幅面遥感影像语义分割方法,该架构为分层图像金字塔结构,最下层的是较小的图像块,简称“Patch”,上层的是较大的影像区域,简称“Region”。“Patch”部分处理的对象是较小的图像块,采用的是融合Transformer的U型结构语义分割网络,输出的是像素级别的语义特征。“Region”部分处理对象为较大的影像区域,为了减少计算的参数量,采用全局平均池化算法将“Patch”块输出的像素级别语义特征转换为“Patch”级别的语义特征,之后通过Transformer模块提取“Region”级别的全局上下文信息,最后聚合全局上下文信息和像素级别的语义特征来获得高质量的分割图。该方法在高分辨率遥感影像处理领域具有广泛的应用前景。

    一种基于TransUnet架构的影像自监督学习方法

    公开(公告)号:CN115331073A

    公开(公告)日:2022-11-11

    申请号:CN202210882058.8

    申请日:2022-07-26

    Abstract: 本发明公开了一种基于TransUnet架构的影像自监督学习方法,该方法在TransUnet架构的基础上,通过掩码自编码方式构建全新的影像自监督学习方法,通过在成本低、无需标注的原始影像上进行自监督训练,获得高质量的影像高阶特征,以此来大幅减轻下游任务的训练难度。为验证方法的有效性,采用建筑物提取数据集进行了影像自监督学习实验,并将其应用到建筑物提取的下游任务,结果表明:由于充分结合了CNN和Transformer各自优势,本发明具有收敛速度快、计算量小、鲁棒性强等优点,在遥感、医疗等领域的小数据集上可以显著提高精度,节省数据集的使用并降低人工标注成本。

Patent Agency Ranking