视频生成方法、深度学习模型的训练方法、装置、设备和存储介质

    公开(公告)号:CN118229815B

    公开(公告)日:2025-05-09

    申请号:CN202410317079.4

    申请日:2024-03-19

    Abstract: 本公开提供了一种视频生成方法,涉及人工智能技术领域,尤其涉及深度学习和计算机视觉技术领域,可应用于人工智能视频生成场景。具体实现方案为:基于图像特征、文本特征、以及图像中目标对象的动作特征,生成目标对象的动作序列;确定动作序列的运动控制特征,运动控制特征用于控制所生成的视频中的目标对象的动作与动作序列一致;以及基于图像特征、文本特征以及运动控制特征,生成目标视频。本公开还提供了一种深度学习模型的训练方法、装置、电子设备和存储介质。

    视频生成方法、装置、电子设备及存储介质

    公开(公告)号:CN119031203A

    公开(公告)日:2024-11-26

    申请号:CN202411266270.7

    申请日:2024-09-10

    Abstract: 本申请公开了视频生成方法、装置、电子设备及存储介质,涉人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于AIGC、数字人、智能电商等场景。实现方案为:获取驱动视频中驱动对象的姿态热图序列;对姿态热图序列进行姿态编码,得到驱动对象的第一姿态特征,在第一姿态特征中添加噪声,得到第二姿态特征;获取展示有目标对象的目标图像,并对目标图像进行外观编码得到目标对象的第一外观特征;获取驱动视频中驱动对象的手部关键点信息,并根据手部关键点信息,获取驱动对象的手部特征;根据第二姿态特征、第一外观特征及手部特征进行特征融合,得到第一融合特征;对第一融合特征进行解码,生成展示有目标对象的目标视频。

    三维眉形的生成方法及装置、电子设备和存储介质

    公开(公告)号:CN117422831B

    公开(公告)日:2024-11-08

    申请号:CN202311435164.2

    申请日:2023-10-31

    Abstract: 本公开提供了一种三维眉形的生成方法及装置、电子设备和存储介质,涉及人工智能技术领域,具体为计算机视觉、增强现实、虚拟现实、深度学习等技术领域,可应用于人工智能的内容生成、数字人等场景。三维眉形的生成方法包括:获取眉形图像,眉形图像标注有多条眉毛参考线,每条眉毛参考线包括眉毛的根部点和外端点;对眉形图像进行深度估计,以得到多条眉毛参考线各自的根部点的深度值和外端点的深度值;基于多条眉毛参考线各自的根部点的深度值和外端点的深度值,生成眉形图像对应的三维眉形。

    动画合成方法及装置、动画合成模型的训练方法及装置

    公开(公告)号:CN116433807B

    公开(公告)日:2024-08-23

    申请号:CN202310440855.5

    申请日:2023-04-21

    Abstract: 本公开提供了一种动画合成方法及装置、动画合成模型的训练方法及装置,涉及人工智能技术领域,具体为计算机视觉、增强现实、虚拟现实、深度学习等技术领域,可应用于元宇宙、数字人等场景。实现方案为:获取音频文件和影像文件,其中,音频文件包括语音信息,影像文件包括目标人物的面部图像;基于音频文件,获取语音特征;基于影像文件,分别获取影像文件中的目标人物的面部特征和身份特征;以及根据语音特征、面部特征和身份特征生成关于目标人物的合成动画。

    视频生成方法、深度学习模型训练方法、装置以及设备

    公开(公告)号:CN116228895B

    公开(公告)日:2023-11-17

    申请号:CN202310076637.8

    申请日:2023-01-16

    Abstract: 本公开提供了一种视频生成方法、深度学习模型训练方法,涉及人工智能技术领域,尤其涉及计算机视觉、增强现实、虚拟现实、深度学习等技术领域,可应用于元宇宙、虚拟数字人等场景。具体实现方案为:对掩码视频帧进行编码,得到掩码视频帧特征,掩码视频帧是对初始视频帧添加掩码得到的,掩码视频帧包括覆盖目标对象的唇形区域的掩码区域;根据掩码视频帧特征、参考视频帧特征以及音频特征,确定与每一个掩码子区域对应的掩码子区域特征离散编码,参考视频帧特征是对参考视频帧编码得到的;根据初始视频帧,确定目标索引;根据目标索引、掩码子区域特征离散编码以及掩码视频帧特征,生成目标视频帧。

    人脸重建方法、装置、电子设备以及存储介质

    公开(公告)号:CN116206035A

    公开(公告)日:2023-06-02

    申请号:CN202310067248.9

    申请日:2023-01-12

    Abstract: 本公开提供了人脸重建方法、装置、电子设备以及存储介质,涉及人工智能技术领域,具体为计算机视觉、图像处理、深度学习等技术领域,可应用于元宇宙、虚拟数字人等场景。具体实现方案为:基于人脸模型当前的第一参数集合,采用光栅化方式得到第一渲染图,并采用光线追踪方式得到第二渲染图;基于第一渲染图与人脸图像,得到第一损失;基于第二渲染图与人脸图像,得到第二损失;基于第一损失以及第二损失,更新第一参数集合;基于符合第一预设条件,则将第一参数集合作为该人脸图像对应的人脸模型的优化参数集合。本公开实施例可提升人脸模型对应的3D人脸与人脸图像相似度。

    虚拟人物表情的驱动方法、装置、电子设备和存储介质

    公开(公告)号:CN115393488B

    公开(公告)日:2023-03-03

    申请号:CN202211338132.6

    申请日:2022-10-28

    Abstract: 本申请公开了虚拟人物表情的驱动方法、装置、电子设备和存储介质,涉及人工智能技术领域,具体为增强现实、虚拟现实、计算机视觉、深度学习等技术领域,可应用于元宇宙、虚拟数字人等场景。具体方案为:获取人脸图像,并将人脸图像输入到三维人脸模型中,得到人脸图像对应的第一人脸状态向量;将第一人脸状态向量输入到系数映射模型,得到人脸图像的多个第一混合变形分别对应的系数;根据多个第一混合变形分别对应的系数,确定虚拟人物的多个第二混合变形分别对应的系数;根据多个第二混合变形分别对应的系数,对虚拟人物的表情进行驱动。该方法提高了表情捕捉的准确性,提高了对虚拟人物表情驱动的准确性,及提高了虚拟人物的表现力。

    虚拟形象处理方法、装置、电子设备和存储介质

    公开(公告)号:CN115359171A

    公开(公告)日:2022-11-18

    申请号:CN202211290001.5

    申请日:2022-10-21

    Abstract: 本公开提供了一种虚拟形象处理方法,涉及人工智能技术领域,尤其涉及增强现实、虚拟现实、计算机视觉、深度学习等技术领域,可应用于虚拟数字人和元宇宙等场景下。具体实现方案为:根据目标图像和第一拓扑,得到与目标图像对应的第一中间拓扑,其中,第一中间拓扑包括多个第一关键点;将第二拓扑的多个第二关键点与第一中间拓扑的多个第一关键点对齐,得到目标拓扑;根据第一中间拓扑的至少一个第一纹理基底和目标拓扑,得到目标虚拟形象;以及根据第二拓扑的预设驱动参数,控制目标虚拟形象执行第一动作。本公开还提供了一种虚拟形象处理装置、电子设备和存储介质。

    分类器的训练方法及装置、分类装置

    公开(公告)号:CN114818947A

    公开(公告)日:2022-07-29

    申请号:CN202210482911.7

    申请日:2022-05-05

    Abstract: 本公开提供了分类器的训练方法及装置、分类装置,涉及计算机技术领域,尤其涉及深度学习领域。具体实现方案为:获取原始不平衡样本集;根据所述原始不平衡样本集和随机噪声生成第一样本集,其中所述第一样本集中包括被标记为正样本的样本和被标记为负样本的样本;从所述第一样本集中剔除不符合预设条件的样本得到目标样本集;以所述原始不平衡样本集和所述目标样本集的合集为训练数据集,对目标分类器进行训练,其中,所述目标分类器用于完成对待分类不平衡样本集的分类。

    基于以太坊的被篡改交易的处理方法、装置及存储介质

    公开(公告)号:CN110086780B

    公开(公告)日:2021-11-02

    申请号:CN201910234038.8

    申请日:2019-03-26

    Abstract: 本发明涉及区块链技术领域,公开了一种基于以太坊的被篡改交易的处理方法、装置及存储介质,解决了现有技术中无法在工程上实现以太坊共识算法抗篡改能力的验证的问题。所述方法包括:将被篡改交易发送至以太坊网络中预先设定的节点,以便所述预先设定的节点将包含所述被篡改交易的区块广播至所述以太坊网络中的所有节点;根据所述以太坊网络中的节点所维护的链上的信息,确定所述被篡改交易对所述以太坊网络的攻击是否成功。本发明实施例适用于以太坊网络共识算法抗篡改攻击能力的验证过程。

Patent Agency Ranking