一种基于多属性驱动Transformer的图像自动裁剪方法和装置

    公开(公告)号:CN117058389A

    公开(公告)日:2023-11-14

    申请号:CN202311087792.6

    申请日:2023-08-28

    Abstract: 本发明公开了一种基于多属性驱动Transformer的图像自动裁剪方法和装置,使用Next‑ViT作为主干网络进行全局特征图的提取,基于此构建主题分支、构图分支和裁剪分支;在主题分支中学习图像的主题属性从而得到主题属性激活图;在构图分支中学习图像的构图属性从而得到构图属性激活图,对构图属性激活图与主题属性激活图进行融合得到多属性激活图;在裁剪分支中设置锚点获取锚点位置特征图,并利用全局关系推理模块得到偏移量特征图,合并锚点位置特征图和偏移量特征图得到裁剪框特征图,归一化多属性激活图得到锚点权重,利用锚点权重对裁剪框特征图进行加权得到预测的裁剪框。本发明通过自动裁剪方法得到高质量裁剪图像,有效改善图像的美学质量。

Patent Agency Ranking