基于大模型的图片生成方法、装置、设备和介质
摘要:
本申请提供一种基于大模型的图片生成方法、装置、设备和介质,涉及智能家居/智慧家庭技术领域。该方法包括:将第一背景图片和文本描述输入位置预测模型,预测得到第一目标物在第一背景图片的目标位置信息;获取目标图片中与第一目标物相同类型的第二目标物,并根据第二目标物的掩码将第二目标物从目标图片中分割出来;根据目标位置信息中的目标位置尺寸与分割出来的第二目标物之间的大小关系,确认分割出来的第二目标物的缩放比例;根据目标位置信息和缩放比例,将分割出来的第二目标物融合至第一背景图片中。本申请的方法可以将目标产品精准融合到背景图片中。
0/0