-
公开(公告)号:CN118628611A
公开(公告)日:2024-09-10
申请号:CN202410772782.4
申请日:2024-06-17
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于交叉注意力重分配的多实例可控图像生成方法,首先构建ChatGPT代码提示链CoC。然后在ChatGPT中使用代码提示链,生成符合多实例文本提示生成任务中所需要的布局。然后在扩散模型每一个时间步中获得交叉注意力图,并基于布局信息,获得两个引导损失。最后使用损失引导修改当前时间步上的预测噪声,迭代优化的噪声图像最终通过解码器得到生成的多实例可控图像。本发明缓解实体缺失、属性互换、属性泄露、空间布局错误等问题的出现,在图像编辑、个性化生成和虚拟试衣等领域中实现更准确、高质量的图像生成和修改,为用户提供更符合个性化需求的服务。