视频生成方法、装置、电子设备及存储介质

    公开(公告)号:CN119031204A

    公开(公告)日:2024-11-26

    申请号:CN202411267110.4

    申请日:2024-09-10

    Abstract: 本申请公开了视频生成方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于AIGC、数字人、智能电商等场景。具体实现方案为:获取展示有目标对象的参考图像对应的参考人体信号及驱动视频对应的驱动人体信号;对参考人体信号和驱动人体信号分别进行动态特征提取,得到第一动态特征和第二动态特征;对参考图像进行纹理特征提取,得到第一纹理特征;对第一动态特征、第二动态特征及第一纹理特征进行交叉注意力计算,得到第二纹理特征;对第二纹理特征、第二动态特征及噪声进行拼接,得到第一拼接特征;根据第一拼接特征进行去噪处理,生成展示有目标对象的目标视频。

    目标对象的驱动方法和驱动模型的训练方法、装置

    公开(公告)号:CN118762129A

    公开(公告)日:2024-10-11

    申请号:CN202410940397.6

    申请日:2024-07-12

    Abstract: 本公开提供了一种目标对象的驱动方法和驱动模型的训练方法、装置、设备、介质、程序产品,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习等技术领域,可应用于生成式人工智能和数字人驱动等场景。目标对象的驱动方法的具体实现方案为:基于包括目标对象的源视频帧及目标音频片段,生成与目标音频片段对应的目标对象的目标三维模型序列;基于目标三维模型序列,渲染得到与目标音频片段对应的初始图像序列;基于初始图像包括的唇部图像以及初始图像与源视频帧之间的对应关系,融合唇部图像与源视频帧,得到融合后图像序列;以及基于融合后图像序列,生成驱动后视频片段,驱动后视频片段中目标对象的唇部形状与目标音频片段相适配。

    人脸活体检测方法、装置、电子设备和存储介质

    公开(公告)号:CN113361349B

    公开(公告)日:2023-08-04

    申请号:CN202110573893.9

    申请日:2021-05-25

    Abstract: 本公开提供一种人脸活体检测方法、装置、电子设备和存储介质,涉及计算机视觉和深度学习技术领域等人工智能技术领域,可应用于智慧城市和智慧金融场景下。具体实现方案为:获取颜色序列验证码;控制电子设备屏幕依次产生相应颜色,并控制电子设备的摄像头采集在相应颜色下目标对象面部的图像,获得目标对象在不同颜色下的图像序列;根据目标对象在不同颜色下的图像序列对目标对象进行人脸活体验证,获得活体分数值;根据目标对象在不同颜色下的图像序列获取图像序列各自颜色所对应的差分图,并根据颜色序列验证码和图像序列各自颜色所对应的差分图进行颜色验证;根据活体分数值和颜色验证结果,确定目标对象的最终人脸活体检测结果。

    活体检测模型训练方法、活体检测方法、装置和电子设备

    公开(公告)号:CN115937993A

    公开(公告)日:2023-04-07

    申请号:CN202211610370.8

    申请日:2022-12-14

    Abstract: 本公开提供了一种活体检测模型训练方法、活体检测方法、装置和电子设备,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域。该方法包括:通过活体检测模型中的特征提取网络对样本图像中的样本人脸区域进行特征提取得到样本人脸特征;通过动态路由网络根据样本人脸特征从至少两个候选活体检测网络中选择目标活体检测网络;通过目标活体检测网络根据样本人脸特征确定样本图像的预测活体信息;根据目标活体检测网络、预测活体信息、样本图像的标注攻击类型和样本图像的标注活体信息,对特征提取网络、动态路由网络和目标活体检测网络进行训练。通过上述技术方案能够提高活体检测的准确性。

    训练方法、预测方法、装置、电子设备以及存储介质

    公开(公告)号:CN113657249A

    公开(公告)日:2021-11-16

    申请号:CN202110934297.9

    申请日:2021-08-13

    Abstract: 本公开提供了一种训练方法、预测方法、装置、电子设备以及存储介质,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于人脸识别等场景下。具体实现方案为:确定与多个场景样本集中的每个场景样本集对应的目标正样本相似度和目标负样本相似度,其中,每个场景样本集对应一个场景;在确定不满足相似度条件的情况下,根据与多个场景中的每个场景对应的目标正样本相似度和目标负样本相似度,分别调整与预设模型对应的损失函数中与场景对应的正样本场景阈值和负样本场景阈值,得到调整后的损失函数;以及基于调整后的损失函数,利用多个场景样本集训练预设模型直至满足相似度条件。

    基于多模态的图像检测方法、装置、电子设备及存储介质

    公开(公告)号:CN113642425A

    公开(公告)日:2021-11-12

    申请号:CN202110859555.1

    申请日:2021-07-28

    Abstract: 本公开提出了基于多模态的图像检测方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习等技术领域,可应用于人脸识别场景下。具体实现方案:获取参考帧图像和待处理帧图像,参考帧图像和待处理帧图像的模态不相同,并从参考帧图像之中识别出参考检测框,以及将参考检测框映射至待处理帧图像之中,以得到目标检测框,目标检测框被用于进行图像检测,能够实现对不同模态图像中的检测框进行准确地映射,当采用映射得到的目标检测框进行图像检测时,能够有效提升复杂场景下图像检测准确率与召回率,提高图像识别系统的有效性。

    人脸活体检测方法、装置、设备及存储介质

    公开(公告)号:CN113205057A

    公开(公告)日:2021-08-03

    申请号:CN202110524896.3

    申请日:2021-05-13

    Abstract: 本公开揭露了人脸活体检测方法,涉及人工智能领域,具体为计算机视觉和深度学习技术,可应用于人脸识别场景下。具体实现方案为:获取包含多个人脸图像的人脸图像序列;基于人脸图像序列,获取对应的包含多个人眼图像的人眼图像序列;基于人眼图像序列,对多个人眼图像中的每个人眼图像中人眼瞳孔显示的光斑颜色进行识别,得到瞳孔颜色识别结果;以及响应于瞳孔颜色识别结果表征人脸图像序列是电子设备现场采集的人脸图像的序列,利用人脸图像序列中的至少一个人脸图像得到人脸活体检测结果。

Patent Agency Ranking