-
公开(公告)号:CN119722875B
公开(公告)日:2025-05-13
申请号:CN202510244910.2
申请日:2025-03-03
Applicant: 之江实验室
Abstract: 本申请涉及图像处理技术领域,公开了一种文本生成图像方法、装置、设备及介质,其中,方法包括:响应于获取到的包含目标对象的文本提示词,生成文本提示词对应的初始图像;其中,文本提示词包括目标对象的目标数量,初始图像包括目标对象的生成数量;在目标数量与生成数量不相等的情况下,对初始图像生成过程中的候选边界框的位置进行优化,生成优化后的边界框;基于优化后的边界框对初始图像生成过程中的当前潜在表示进行优化,得到目标潜在表示;基于目标潜在表示更新初始图像,生成目标图像,以使目标图像中目标对象的生成数量与目标数量相等。本申请提供的技术方案,能够精确控制生成图像中目标数量。
-
公开(公告)号:CN119722875A
公开(公告)日:2025-03-28
申请号:CN202510244910.2
申请日:2025-03-03
Applicant: 之江实验室
Abstract: 本申请涉及图像处理技术领域,公开了一种文本生成图像方法、装置、设备及介质,其中,方法包括:响应于获取到的包含目标对象的文本提示词,生成文本提示词对应的初始图像;其中,文本提示词包括目标对象的目标数量,初始图像包括目标对象的生成数量;在目标数量与生成数量不相等的情况下,对初始图像生成过程中的候选边界框的位置进行优化,生成优化后的边界框;基于优化后的边界框对初始图像生成过程中的当前潜在表示进行优化,得到目标潜在表示;基于目标潜在表示更新初始图像,生成目标图像,以使目标图像中目标对象的生成数量与目标数量相等。本申请提供的技术方案,能够精确控制生成图像中目标数量。
-