一种基于隐空间操作和文本引导的自适应图像编辑方法

    公开(公告)号:CN115797503A

    公开(公告)日:2023-03-14

    申请号:CN202211267694.6

    申请日:2022-10-17

    Abstract: 本发明提供的一种基于隐空间操作和文本引导的自适应图像编辑方法,将待编辑图像输入至训练好的自适应方向隐空间映射ADLM网络,通过对图像自适应的逐信道组操作,可以提高图像编辑的效率,此外通过利用多模态融合网络的语义一致性损失,强制对齐预估编辑图像与对应的历史图像之间的差异值,与给定的描述文本的语义变化方向,以实现精确对齐图像属性与文本提示之间的一致性关系,确保ADLM网络对待编辑图像进行逐信道组操作的精确属性解耦,同时提出基于离散空间频率的重建损失,用于保留图像的不相关部分,从而确保编辑过程与文本提示不相关的部分在编辑时不被修改,以提高输出预估编辑图像的完整性。

Patent Agency Ranking