虚拟人视频生成方法、装置、电子设备及存储介质

    公开(公告)号:CN119364141A

    公开(公告)日:2025-01-24

    申请号:CN202411462352.9

    申请日:2024-10-18

    Inventor: 张海薇

    Abstract: 本发明提供一种虚拟人视频生成方法、装置、电子设备及存储介质,涉及人工智能技术领域,该方法中通过将每个视频帧中的人脸图像、遮盖图像以及语音特征一同输入至目标图像生成模型进行处理,可以使最终得到的虚拟人视频与待处理视频相比,仅虚拟人的口型发生变化,与驱动语音一致,姿态依然保持一致,可以使虚拟人形象更加逼真,提高用户的观看体验。而且,该方法中将人脸图像和遮盖图像分别进行编码,可以使人脸图像的信息得到充分应用,进而结合自注意力机制以及交叉注意力机制,将图像特征与语音特征进行融合,使人脸图像的细节保持度更高,降低虚拟人与真人的差异,提高虚拟人视频的逼真效果。

Patent Agency Ranking