基于共享注意力的多模态人物图像生成方法

    公开(公告)号:CN118552663A

    公开(公告)日:2024-08-27

    申请号:CN202410601732.X

    申请日:2024-05-15

    Abstract: 本发明公开了基于共享注意力的多模态人物图像生成方法,该方法首先对现有的多模态人物数据集进行预处理,构建人物图像、人物分割图、文本信息、语义信息数据组。其次构建包含基于小波变换的离散变分自编码器模型和基于共享注意力的多模态条件扩散模型,通过输入的数据组,得到生成的人物图像。最后利用反向传播算法多模态人物图像生成模型参数,直至收敛。本发明生成高保真且多样性的全身人物图像,能够有效地满足输入的多模态控制条件,对于推动计算机视觉领域中的人物图像生成具有重要意义。

    一种基于时序增强扩散模型的视频虚拟试衣方法

    公开(公告)号:CN119398865A

    公开(公告)日:2025-02-07

    申请号:CN202411443269.7

    申请日:2024-10-16

    Abstract: 本发明公开了一种基于时序增强扩散模型的视频虚拟试衣方法,该方法首先基于时尚数据集,构建时尚视频序列、姿态序列、语义序列和深度序列数据组。其次通过使用形变网络将服装依据姿态序列和深度序列逐帧映射到对应形变空间,得到形变服装序列作为扩散网络的指导条件。然后以生成时尚试穿视频为目标,在标准稳定扩散模型的基础上构建时序增强网络以及人体特征注入模块,将形变服装序列与时尚视频序列合成得到虚拟试衣视频序列。最后分别使用扩散损失和感知损失,通过反向传播算法对时序增强网络和人物特征注入模块中的模型参数进行训练。本发明提高用户的使用体验,推动虚拟试穿技术在电商和时尚行业的应用和发展。

Patent Agency Ranking