-
公开(公告)号:CN119295661A
公开(公告)日:2025-01-10
申请号:CN202411371706.9
申请日:2024-09-29
Applicant: 同济大学
IPC: G06T17/00 , G06T15/00 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了基于3D信息注入的视角可控图像生成方法,旨在解决现有图像生成模型在特定对象视角控制方面的不足。通过融合3D信息和文本描述,此方法能够在多样化的场景和背景下生成逼真的特定对象图像。它采用了多层感知机和transformer等模型,以处理视角信息和文本特征,进而通过stable diffusion模型的U‑Net实现条件控制的图像生成。此外,引入位姿预测模块和新的损失函数,不仅提高了视角准确性,也增强了模型的适应性和生成图像的个性化程度。这种方法的实施有望推动图像生成技术在个性化和可控性方面的发展。