视频生成方法、装置、电子设备及存储介质

    公开(公告)号:CN119031203A

    公开(公告)日:2024-11-26

    申请号:CN202411266270.7

    申请日:2024-09-10

    Abstract: 本申请公开了视频生成方法、装置、电子设备及存储介质,涉人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于AIGC、数字人、智能电商等场景。实现方案为:获取驱动视频中驱动对象的姿态热图序列;对姿态热图序列进行姿态编码,得到驱动对象的第一姿态特征,在第一姿态特征中添加噪声,得到第二姿态特征;获取展示有目标对象的目标图像,并对目标图像进行外观编码得到目标对象的第一外观特征;获取驱动视频中驱动对象的手部关键点信息,并根据手部关键点信息,获取驱动对象的手部特征;根据第二姿态特征、第一外观特征及手部特征进行特征融合,得到第一融合特征;对第一融合特征进行解码,生成展示有目标对象的目标视频。

    交互图像生成模型、交互图像的生成方法、装置及设备

    公开(公告)号:CN119863563A

    公开(公告)日:2025-04-22

    申请号:CN202411899883.4

    申请日:2024-12-20

    Abstract: 本公开提出一种交互图像生成模型、交互图像的生成方法、装置及设备,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,应用于人工智能生成内容AIGC等场景。提出交互图像生成模型,包括物体特征处理网络、结构关系处理网络、手部结构特征处理网络、手部复原网络、物体复原网络及解码器。交互图像生成模型对包含目标物体的图像进行处理,得到目标物体外观特征;将参考关系图与外观特征进行融合,输出交互特征;将手部结构特征处理网络输出的手部结构特征、交互特征及已生成的手部纹理特征进行融合,得到第一特征图;将第一特征图及已生成的物体纹理特征进行融合,得到待解码的第二特征图;对第二特征图进行解码,生成交互图。

    图像处理方法、图像处理模型和训练方法

    公开(公告)号:CN116228897A

    公开(公告)日:2023-06-06

    申请号:CN202310251906.X

    申请日:2023-03-10

    Abstract: 本公开提供了一种图像处理方法、图像处理模型和训练方法,人工智能技术领域,具体为计算机视觉、增强现实、虚拟现实、深度学习等技术领域,可应用于元宇宙、数字人等场景。实现方案为:确定包括目标对象的目标图像序列;对所述目标图像序列进行编码,以得到目标离散序列,其中所述目标离散序列中的每个元素对应于所述目标图像序列中的图像的一局部区域;基于各个元素对应的局部区域的解码图像特征确定对应于所述目标图像序列的解码特征序列;对所述解码特征序列进行解码,以得到包括所述目标对象的预测图像序列。

    数字人驱动模型生成方法、装置、电子设备及存储介质

    公开(公告)号:CN119992416A

    公开(公告)日:2025-05-13

    申请号:CN202510065975.0

    申请日:2025-01-15

    Abstract: 本公开提供了数字人驱动模型生成方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型、增强现实等技术领域,可应用于数字人等场景。具体实现方案为:基于参考视频确定第一合成序列、第二合成序列、语音特征标记序列、参考特征标记和面部特征标记;基于第一合成序列、语音特征标记序列、参考特征标记和面部特征标记训练第一子模型,以使第一子模型输出第一驱动视频;基于第二合成序列、参考特征标记和面部特征标记训练第二子模型,以使第二子模型输出第二驱动视频;基于训练后的第一子模型和第二子模型生成数字人驱动模型。本方案能提高数字人驱动模型生成数字人视频的质量。

    一种图像生成方法、装置、电子设备和介质

    公开(公告)号:CN115359166B

    公开(公告)日:2023-03-24

    申请号:CN202211283618.4

    申请日:2022-10-20

    Abstract: 本公开提供了一种图像生成方法、装置、电子设备和介质,涉及人工智能技术领域,具体为计算机视觉、增强现实、虚拟现实、深度学习等技术领域,可应用于元宇宙、虚拟数字人等场景。具体实现方案为:确定目标人物形象在目标图像中的第一面部特征,并根据第一面部特征生成目标人物形象的第一面部轮廓图像;确定样本人物形象在样本图像中的第二面部特征,并根据第二面部特征生成样本人物形象的第二面部轮廓图像;根据目标图像、第一面部轮廓图像和第二面部轮廓图像,生成包含目标人物形象的待展示图像。本公开能够提高根据样本图像生成包含目标人物形象的待展示图像的速度,减少了待展示图像生成所消耗的时间。

    一种图像生成方法、装置、电子设备和介质

    公开(公告)号:CN115359166A

    公开(公告)日:2022-11-18

    申请号:CN202211283618.4

    申请日:2022-10-20

    Abstract: 本公开提供了一种图像生成方法、装置、电子设备和介质,涉及人工智能技术领域,具体为计算机视觉、增强现实、虚拟现实、深度学习等技术领域,可应用于元宇宙、虚拟数字人等场景。具体实现方案为:确定目标人物形象在目标图像中的第一面部特征,并根据第一面部特征生成目标人物形象的第一面部轮廓图像;确定样本人物形象在样本图像中的第二面部特征,并根据第二面部特征生成样本人物形象的第二面部轮廓图像;根据目标图像、第一面部轮廓图像和第二面部轮廓图像,生成包含目标人物形象的待展示图像。本公开能够提高根据样本图像生成包含目标人物形象的待展示图像的速度,减少了待展示图像生成所消耗的时间。

    视频生成方法、装置、电子设备及存储介质

    公开(公告)号:CN119031204A

    公开(公告)日:2024-11-26

    申请号:CN202411267110.4

    申请日:2024-09-10

    Abstract: 本申请公开了视频生成方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于AIGC、数字人、智能电商等场景。具体实现方案为:获取展示有目标对象的参考图像对应的参考人体信号及驱动视频对应的驱动人体信号;对参考人体信号和驱动人体信号分别进行动态特征提取,得到第一动态特征和第二动态特征;对参考图像进行纹理特征提取,得到第一纹理特征;对第一动态特征、第二动态特征及第一纹理特征进行交叉注意力计算,得到第二纹理特征;对第二纹理特征、第二动态特征及噪声进行拼接,得到第一拼接特征;根据第一拼接特征进行去噪处理,生成展示有目标对象的目标视频。

    图像处理方法、图像处理模型和训练方法

    公开(公告)号:CN116228897B

    公开(公告)日:2024-04-23

    申请号:CN202310251906.X

    申请日:2023-03-10

    Abstract: 本公开提供了一种图像处理方法、图像处理模型和训练方法,人工智能技术领域,具体为计算机视觉、增强现实、虚拟现实、深度学习等技术领域,可应用于元宇宙、数字人等场景。实现方案为:确定包括目标对象的目标图像序列;对所述目标图像序列进行编码,以得到目标离散序列,其中所述目标离散序列中的每个元素对应于所述目标图像序列中的图像的一局部区域;基于各个元素对应的局部区域的解码图像特征确定对应于所述目标图像序列的解码特征序列;对所述解码特征序列进行解码,以得到包括所述目标对象的预测图像序列。

Patent Agency Ranking