-
公开(公告)号:CN119031203A
公开(公告)日:2024-11-26
申请号:CN202411266270.7
申请日:2024-09-10
Applicant: 北京百度网讯科技有限公司
IPC: H04N21/81 , H04N21/234 , H04N21/2343 , H04N21/44 , H04N21/4402 , G06V40/10 , G06V40/16
Abstract: 本申请公开了视频生成方法、装置、电子设备及存储介质,涉人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于AIGC、数字人、智能电商等场景。实现方案为:获取驱动视频中驱动对象的姿态热图序列;对姿态热图序列进行姿态编码,得到驱动对象的第一姿态特征,在第一姿态特征中添加噪声,得到第二姿态特征;获取展示有目标对象的目标图像,并对目标图像进行外观编码得到目标对象的第一外观特征;获取驱动视频中驱动对象的手部关键点信息,并根据手部关键点信息,获取驱动对象的手部特征;根据第二姿态特征、第一外观特征及手部特征进行特征融合,得到第一融合特征;对第一融合特征进行解码,生成展示有目标对象的目标视频。