一种基于跨空间调节的文本驱动的风格迁移方法

    公开(公告)号:CN119831826A

    公开(公告)日:2025-04-15

    申请号:CN202411701484.2

    申请日:2024-11-26

    Abstract: 本发明公开了一种基于跨空间调节的文本驱动的风格迁移方法,包括:利用预训练的深度卷积神经网络VGG‑19从任意一张给定的照片中提取内容特征;利用预训练的CLIP文本编码器从任意一个给定的文本提示中提取风格特征;构造跨空间调节模块,用于弥合VGG特征空间和CLIP特征空间之间的差异;构造内容损失函数、定向CLIP损失函数、块对块CLIP损失函数以及基于CLIP的风格对比损失函数,用于约束风格迁移网络的生成过程,最终得到与目标内容和目标风格相符的艺术图像。本发明能够将文本中所描述的艺术风格迁移到日常照片上,创造出新的艺术图像,提升了艺术图像创意生成的灵活性和创新性,在文化创意、影视制作、工业设计等诸多领域有着重要的科学意义和应用价值。

Patent Agency Ranking