过渡视频生成方法、虚拟角色视频切换方法、装置及设备

    公开(公告)号:CN119996766A

    公开(公告)日:2025-05-13

    申请号:CN202510036966.9

    申请日:2025-01-09

    Abstract: 本申请提出一种过渡视频生成方法、虚拟角色视频切换方法、装置及设备,应用于人工智能技术领域。其中,该过渡视频生成方法包括:获取第一动画视频和第二动画视频,第一动画视频和第二动画视频是同一虚拟角色的不同动画视频;在第一动画视频的时间轴上,确定打断时间点;根据打断时间点处的视频帧和第二动画视频中的视频帧,生成打断时间点对应的过渡视频,过渡视频用于从播放第一动画视频切换至播放第二动画视频的过渡阶段。从而,通过设置打断时间点和提前生成过渡视频的方式,提高虚拟角色动画视频切换的流畅性。

    合成视频的方法、电子设备及计算机程序产品

    公开(公告)号:CN119323625B

    公开(公告)日:2025-05-09

    申请号:CN202411866722.5

    申请日:2024-12-18

    Abstract: 本申请提出一种合成视频的方法、电子设备及计算机程序产品。该合成视频的方法包括:获取包含第一虚拟对象的第一视频以及包含目标虚拟对象的肢体动作的第二视频,针对第一视频,去除目标视频段中第一虚拟对象的目标肢体部位,得到待合成视频,目标视频段为第一视频中对应动作插入时段的视频段;基于第二视频和目标视频段的时序对应关系,将第二视频各视频帧的目标肢体部位拼接到待合成视频各视频帧的目标肢体部位缺失处,生成合成视频。由于第二视频仅包含目标肢体部位,因此,可以做到虚拟对象与肢体动作的解耦。在虚拟对象为虚拟人物的情况下,制作第二视频/动作视频时,无需考虑人物主要身体部位的穿着打扮,甚至无需考虑人物的身份。

    视频生成方法、装置、电子设备和计算机程序产品

    公开(公告)号:CN119922351A

    公开(公告)日:2025-05-02

    申请号:CN202411771790.3

    申请日:2024-12-04

    Abstract: 本申请提出一种视频生成方法、装置、电子设备和计算机程序产品,该方法能够基于复刻对象的音频和参考图像,生成复刻对象的虚拟形象视频。具体可以根据音频和参考图像,生成复刻对象口唇区域的动态图像,结合口唇区域的动态图像、参考图像和音频对应的情绪状态,得到复刻对象的动态图像;或者,从音频和参考图像中提取得到复刻特征,根据复刻特征和音频对应的情绪状态生成复刻对象的动态图像,然后根据音频和复刻对象的动态图像,生成复刻对象的虚拟形象视频,实现复刻特定对象的虚拟形象的目的。

    图像生成方法、装置、电子设备和存储介质

    公开(公告)号:CN119784879A

    公开(公告)日:2025-04-08

    申请号:CN202510279975.0

    申请日:2025-03-11

    Abstract: 本发明涉及图像处理技术领域,提供了一种图像生成方法、装置、电子设备和存储介质,其中方法包括:获取图像描述文本,并确定所述图像描述文本中的领域知识和通用知识,以及领域知识和通用知识分别对应的路由权重;基于领域知识,从领域知识库中进行知识检索,得到参考图像;领域知识库动态更新;基于参考图像、通用知识,以及领域知识和通用知识分别对应的路由权重进行图像生成,得到生成的目标图像;其中,路由权重用于反映对应知识在目标图像上的呈现度,利用动态知识检索的优势进行特定领域的知识检索,可以为特定领域的知识生成提供参考,同时借助动态路由策略进行图像生成,不仅保证了生成的图像的准确性,也增强了多样性和细节丰富性。

    一种解码网络生成方法、装置、设备及可读存储介质

    公开(公告)号:CN109087645B

    公开(公告)日:2021-04-30

    申请号:CN201811244331.4

    申请日:2018-10-24

    Abstract: 本申请实施例提供了一种解码网络生成方法、装置、设备及可读存储介质,本申请将可枚举的受限说法通过编写语法的形式表达,并获取该形成的语法文本,语法文本中包含至少一槽,与每一槽对应的至少一词条,以及每一槽的位置信息,进一步通过解析所述语法文本,根据每一槽的位置信息及每一槽对应的各词条,生成解码网络,用于对本地语音识别过程中,受限说法的词条进行识别。进一步,由于本申请获取的语法文本中包含每一槽的位置信息,且可以根据槽的位置信息及槽对应的词条来生成解码网络,后续若需要新增词条,可以根据该新增词条所属的槽的位置信息,便捷的将新增词条插入解码网络中,实现解码网络方便、快速的更新。

    一种解码网络生成方法、装置、设备及可读存储介质

    公开(公告)号:CN109087645A

    公开(公告)日:2018-12-25

    申请号:CN201811244331.4

    申请日:2018-10-24

    Abstract: 本申请实施例提供了一种解码网络生成方法、装置、设备及可读存储介质,本申请将可枚举的受限说法通过编写语法的形式表达,并获取该形成的语法文本,语法文本中包含至少一槽,与每一槽对应的至少一词条,以及每一槽的位置信息,进一步通过解析所述语法文本,根据每一槽的位置信息及每一槽对应的各词条,生成解码网络,用于对本地语音识别过程中,受限说法的词条进行识别。进一步,由于本申请获取的语法文本中包含每一槽的位置信息,且可以根据槽的位置信息及槽对应的词条来生成解码网络,后续若需要新增词条,可以根据该新增词条所属的槽的位置信息,便捷的将新增词条插入解码网络中,实现解码网络方便、快速的更新。

    合成视频的方法、电子设备及计算机程序产品

    公开(公告)号:CN119323625A

    公开(公告)日:2025-01-17

    申请号:CN202411866722.5

    申请日:2024-12-18

    Abstract: 本申请提出一种合成视频的方法、电子设备及计算机程序产品。该合成视频的方法包括:获取包含第一虚拟对象的第一视频以及包含目标虚拟对象的肢体动作的第二视频,针对第一视频,去除目标视频段中第一虚拟对象的目标肢体部位,得到待合成视频,目标视频段为第一视频中对应动作插入时段的视频段;基于第二视频和目标视频段的时序对应关系,将第二视频各视频帧的目标肢体部位拼接到待合成视频各视频帧的目标肢体部位缺失处,生成合成视频。由于第二视频仅包含目标肢体部位,因此,可以做到虚拟对象与肢体动作的解耦。在虚拟对象为虚拟人物的情况下,制作第二视频/动作视频时,无需考虑人物主要身体部位的穿着打扮,甚至无需考虑人物的身份。

    语音识别方法、装置、设备及存储介质

    公开(公告)号:CN113920999A

    公开(公告)日:2022-01-11

    申请号:CN202111274880.8

    申请日:2021-10-29

    Abstract: 本申请提出一种语音识别方法、装置、设备及存储介质,该方法包括:获取待识别语音的声学状态序列;基于所述待识别语音所属场景下的垂类关键字集合及句式解码网络,构建语音识别解码网络,其中,所述句式解码网络通过对所述待识别语音所属场景下的文本语料进行句式归纳和语法槽定义处理构建得到;利用所述语音识别解码网络对所述声学状态序列进行解码,得到语音识别结果。通过构建上述的语音识别解码网络,并用于语音识别,能够准确识别待识别语音,尤其是能够准确识别涉及垂类关键字的特定场景下的语音,特别是能准确识别语音中的垂类关键字。

Patent Agency Ranking