一种基于时序增强扩散模型的视频虚拟试衣方法

    公开(公告)号:CN119398865A

    公开(公告)日:2025-02-07

    申请号:CN202411443269.7

    申请日:2024-10-16

    Abstract: 本发明公开了一种基于时序增强扩散模型的视频虚拟试衣方法,该方法首先基于时尚数据集,构建时尚视频序列、姿态序列、语义序列和深度序列数据组。其次通过使用形变网络将服装依据姿态序列和深度序列逐帧映射到对应形变空间,得到形变服装序列作为扩散网络的指导条件。然后以生成时尚试穿视频为目标,在标准稳定扩散模型的基础上构建时序增强网络以及人体特征注入模块,将形变服装序列与时尚视频序列合成得到虚拟试衣视频序列。最后分别使用扩散损失和感知损失,通过反向传播算法对时序增强网络和人物特征注入模块中的模型参数进行训练。本发明提高用户的使用体验,推动虚拟试穿技术在电商和时尚行业的应用和发展。

    一种指令驱动的个性化时尚图像编辑方法

    公开(公告)号:CN119693505A

    公开(公告)日:2025-03-25

    申请号:CN202510211261.6

    申请日:2025-02-25

    Abstract: 本发明公开了一种指令驱动的个性化时尚图像编辑方法。本发明:1、定义编辑任务的类别,针对不同的编辑任务,构建“原始图像‑参考图像‑目标图像‑文本编辑指令”四元数据组;2、构建目标语义网络,生成遵循编辑指令和原始图像的目标图像语义信息,以此作为编辑模型的人体语义信息;3、构建统一编辑网络,包括构建语义控制网络、增加视觉联合模块以及应用低秩微调模块,实现多项编辑任务使用相同的框架获得对应的编辑能力;4、构建多任务低秩调整模块,通过联合训练使框架具备将不同编辑指令对齐到不同编辑任务的能力。最终,实现不同任务间独立又统一的框架。本发明在构建的特定数据集上进行了实验,在定量和定性上都取得了很好的结果。

Patent Agency Ranking