-
公开(公告)号:CN117876522A
公开(公告)日:2024-04-12
申请号:CN202410069798.9
申请日:2024-01-17
Applicant: 中国科学院计算技术研究所
IPC: G06T11/00 , G06T5/70 , G06N3/0455 , G06N3/08 , G06N3/0464 , G06F40/205 , G06F40/30
Abstract: 本发明提出一种基于解耦自增强的细节可控个性化图像生成方法和系统,包括:获取参考概念图像和文本指令,构造文本指令的属性描述,基于概念图像的概念特征和属性描述,生成多个初始图像并筛选,将筛选后的每张初始图像与其对应的属性描述作为训练样本;为训练样本中初始图像添噪得到噪声图像,将噪声图像和其对应的属性描述送入包括文本编码器的扩散网络,扩散网络根据属性描述,预测噪声图像中所添加的噪声,根据预测结果和真实添加噪声构建损失函数训练扩散网络,得到图像生成模型;将具有目标属性的图像生成文本指令和噪声图像输入图像生成模型,图像生成模型根据图像生成文本指令为噪声图像去噪,得到图像生成文本指令对应的图像生成结果。