视频插帧方法、装置、电子设备、存储介质及产品

    公开(公告)号:CN119544905A

    公开(公告)日:2025-02-28

    申请号:CN202411674436.9

    申请日:2024-11-21

    Abstract: 本申请提出一种视频插帧方法、装置、电子设备、存储介质及产品,该方法基于运动模糊预测算法,预测第一图像帧和第二图像帧之间的插入帧的运动模糊权重;其中,第一图像帧和第二图像帧为待插帧视频中的相邻图像帧;基于插帧生成算法,利用运动模糊权重、第一图像帧的像素信息和第二图像帧的像素信息,生成插入帧的第一像素信息;运动模糊预测算法和插帧生成算法是以对第一样本图像帧和第二样本图像帧进行样本插入帧生成时的损失函数最小为目标训练确定的。本方案在确定相邻图像帧之间的插入帧时,对相邻图像帧进行运动模糊分析,运动模糊效果能够捕捉到运动路径和运动速度,从而能够提高插入帧生成准确度,保证插帧效果,进而提高视频流畅度。

    手语生成方法、装置、电子设备、存储介质及产品

    公开(公告)号:CN119418714A

    公开(公告)日:2025-02-11

    申请号:CN202411485954.6

    申请日:2024-10-23

    Abstract: 本申请提出一种手语生成方法、装置、电子设备、存储介质及产品,该方法对说话人的语音音频中的每帧音频帧进行情感分类,确定语音音频对应的情感特征序列;基于语音音频和情感特征序列,对说话人动作图片帧中的说话人面部动作和手部动作进行调整,生成语音音频对应的说话人手语动作图片序列。采用本申请的技术方案,能够将语音音频结合语音音频的情感特征对说话人动作图片帧中的说话人面部动作和手部动作进行调整,使得说话人的手语动作和面部表情具有情感特征,提高了手语生成的情感度。另外,说话人手语动作图片序列中的说话人面部动作和手部动作的风格与听障人士的手语表达风格相同,提高了手语生成的准确度,更方便听障人士的理解。

    合成视频的方法、电子设备及计算机程序产品

    公开(公告)号:CN119323625A

    公开(公告)日:2025-01-17

    申请号:CN202411866722.5

    申请日:2024-12-18

    Abstract: 本申请提出一种合成视频的方法、电子设备及计算机程序产品。该合成视频的方法包括:获取包含第一虚拟对象的第一视频以及包含目标虚拟对象的肢体动作的第二视频,针对第一视频,去除目标视频段中第一虚拟对象的目标肢体部位,得到待合成视频,目标视频段为第一视频中对应动作插入时段的视频段;基于第二视频和目标视频段的时序对应关系,将第二视频各视频帧的目标肢体部位拼接到待合成视频各视频帧的目标肢体部位缺失处,生成合成视频。由于第二视频仅包含目标肢体部位,因此,可以做到虚拟对象与肢体动作的解耦。在虚拟对象为虚拟人物的情况下,制作第二视频/动作视频时,无需考虑人物主要身体部位的穿着打扮,甚至无需考虑人物的身份。

    运动仿真方法、装置、电子设备和存储介质

    公开(公告)号:CN119417956A

    公开(公告)日:2025-02-11

    申请号:CN202411478902.6

    申请日:2024-10-22

    Abstract: 本发明提供一种运动仿真方法、装置、电子设备和存储介质,其中方法包括:基于虚拟运动参数,从各种步态序列中,选取出仿真所需的目标序列,所述各种步态序列是基于真实运动视频中各帧图像的步态识别结果,对所述真实运动视频进行划分得到的;基于所述目标序列,进行运动仿真。本发明提供的方法、装置、电子设备和存储介质,需基础的摄像机即可实现,无需成套的拍摄设备,且一条真实运动视频即可拆分各种步态序列以支持运动仿真,运动仿真所需的视频数据量大减,这使得运动仿真所需的成本大大降低,为运动仿真的实现提供了便利。另外,以步态识别结果拆分所得的步态序列,实现了针对运动仿真的精细化控制,有助于运动仿真的效果优化。

    视频生成方法、装置、电子设备和存储介质

    公开(公告)号:CN115996303B

    公开(公告)日:2023-07-25

    申请号:CN202310290547.9

    申请日:2023-03-23

    Abstract: 本发明涉及图像处理技术领域,提供一种视频生成方法、装置、电子设备和存储介质。方法包括:获取混合语音和多人画面,并对所述多人画面进行人脸检测,获得多个人脸图像,所述混合语音包括至少一人的语音;基于所述多个人脸图像的图像特征和所述混合语音的语音特征,生成多个目标人脸图像组,任一所述目标人脸图像组包括一个人在不同帧的目标人脸图像;将所述多个目标人脸图像组与所述多人画面进行融合,得到多帧目标多人同屏画面,并将所述多帧目标多人同屏画面与所述混合语音进行融合,得到多人会话视频。本发明无需对多个人的视频进行合成即可自动生成多人同屏的多人会话视频,从而节省人工成本,提高多人会话视频的制作效率。

    视频生成方法、装置、电子设备和存储介质

    公开(公告)号:CN115996303A

    公开(公告)日:2023-04-21

    申请号:CN202310290547.9

    申请日:2023-03-23

    Abstract: 本发明涉及图像处理技术领域,提供一种视频生成方法、装置、电子设备和存储介质。方法包括:获取混合语音和多人画面,并对所述多人画面进行人脸检测,获得多个人脸图像,所述混合语音包括至少一人的语音;基于所述多个人脸图像的图像特征和所述混合语音的语音特征,生成多个目标人脸图像组,任一所述目标人脸图像组包括一个人在不同帧的目标人脸图像;将所述多个目标人脸图像组与所述多人画面进行融合,得到多帧目标多人同屏画面,并将所述多帧目标多人同屏画面与所述混合语音进行融合,得到多人会话视频。本发明无需对多个人的视频进行合成即可自动生成多人同屏的多人会话视频,从而节省人工成本,提高多人会话视频的制作效率。

Patent Agency Ranking