-
公开(公告)号:CN112017140B
公开(公告)日:2024-04-12
申请号:CN202010963667.7
申请日:2020-09-14
Applicant: 北京百度网讯科技有限公司
IPC: G06T5/50
Abstract: 本申请公开了用于处理人物形象数据的方法和装置,涉及计算机视觉和深度学习技术领域。具体实施方式包括:获取第一人物的人物形象视频,作为第一数据,并获取第二人物的人物形象视频,作为第二数据,第一人物的人物形象视频中具有多种动态形象;以从第二数据中提取的头像,更换从第一数据中提取的头像;以从第二数据中提取的人脸,更换从第一数据中提取的人脸;以更换后人脸更换更换后头像中的人脸,得到目标头像。本申请通过换头操作,让换头后头像具有不同头像的不同特点。并且,利用动态形象丰富的第一人物进行结合,可以弥补第二人物动态形象丰富度不足的问题。此外,针对人脸进行的换脸操作,可以有效提高更换后头像中人脸的清晰度。
-
公开(公告)号:CN111524062B
公开(公告)日:2023-11-24
申请号:CN202010320769.7
申请日:2020-04-22
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请实施例公开了图像生成方法和装置。该方法的一具体实施方式包括:获取待处理人脸图像中的多个关键点;对该待处理人脸图像进行三角剖分,生成以该多个关键点为顶点的多个三角网格;对于该待处理人脸图像所包含的人脸的指定局部,获取该指定局部的关键点在指定方向上待偏移的偏移量;按照所获取的偏移量,对该指定局部的关键点进行偏移处理,以使以偏移的关键点为顶点的三角网格形变,生成目标人脸图像。本申请实施例通过将局部的关键点进行偏移处理,可以让关键点所连成的线条的形状发生改变,提高了图像的丰富性,进而有助于提高训练样本的丰富性。
-
公开(公告)号:CN112819921B
公开(公告)日:2023-09-26
申请号:CN202011379566.1
申请日:2020-11-30
Applicant: 北京百度网讯科技有限公司
IPC: G06T11/40 , G06V40/10 , G06V10/44 , G06V10/56 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本公开涉及人工智能领域,具体为计算机视觉和深度学习技术,更具体地,公开了用于改变人物的发型的方法、装置、设备和存储介质。在一种方法中,确定包括所述人物的原始图像的原始特征向量,所述原始图像中的所述人物具有原始发型。基于发型分类模型,获取与所述原始发型和所述目标发型相关联的边界向量。基于所述原始特征向量和所述边界向量,确定与所述目标发型相对应的目标特征向量。基于所述目标特征向量生成包括所述人物的目标图像,所述目标图像中的所述人物具有所述目标发型。采用上述实现方式,可以大大降低对于训练数据的要求,降低训练过程的计算量并且获得逼真的目标图像。
-
公开(公告)号:CN114677625B
公开(公告)日:2023-09-08
申请号:CN202210271372.2
申请日:2022-03-18
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种目标检测方法、装置、设备、存储介质和程序产品,涉及深度学习、计算机视觉等人工智能技术领域。具体实现方案为:根据第一视频帧顺序对视频中多帧进行关键点检测,获取所述多帧中每一帧的第一关键点位置;根据第二视频帧顺序对所述多帧进行关键点检测,获取所述多帧中每一帧的第二关键点位置,所述第一视频帧顺序和所述第二视频帧顺序相反;针对所述多帧中每一帧,根据所述第一关键点位置和第二关键点位置确定目标位置。本公开可以提高目标检测的准确性。
-
公开(公告)号:CN114140320B
公开(公告)日:2023-09-01
申请号:CN202111502659.3
申请日:2021-12-09
Applicant: 北京百度网讯科技有限公司
IPC: G06T3/00 , G06T7/00 , G06T7/12 , G06V10/40 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本公开提供了一种图像迁移方法和图像迁移模型的训练方法、装置、设备、介质,涉及人工智能领域,具体涉及深度学习和计算机视觉技术领域,可应用于人脸图像处理、人脸识别等场景。图像迁移方法包括:根据第一对象的目标部位在第一图像中的第一位置信息和第一图像,分别提取第一对象的第一属性特征和目标部位的第一形状特征;提取第二图像包括的第二对象的第一身份特征;以及基于第一属性特征、第一形状特征和第一身份特征生成第一迁移图像,该第一迁移图像包括具有第一属性特征和第一形状特征的第二对象。
-
公开(公告)号:CN111709878B
公开(公告)日:2023-06-23
申请号:CN202010552759.6
申请日:2020-06-17
Applicant: 北京百度网讯科技有限公司
IPC: G06T3/40 , G06T7/11 , G06V40/16 , G06V10/774
Abstract: 本申请实施例公开了人脸超分辨率实现方法、装置、电子设备及存储介质,涉及人脸图像处理和深度学习领域。具体实现方案为:提取第一图像中的人脸部分;将人脸部分输入预先训练的人脸超分辨率模型,得到超清人脸图;获取超清人脸图对应的语义分割图;利用语义分割图,采用超清人脸图替代第一图像中的人脸部分,得到人脸超分辨率的图像。本申请实施例能够提高人脸图像的分辨率。
-
公开(公告)号:CN111462007B
公开(公告)日:2023-06-09
申请号:CN202010244882.1
申请日:2020-03-31
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了图像处理方法、装置、设备及计算机存储介质,涉及计算机技术领域,尤其涉及图像处理领域。具体实现方案为:确定第一图像中的目标区域;根据目标区域,确定第一图像中包括目标区域的第一目标图像块;根据第一目标图像块,确定第二图像中的第二目标图像块;在目标区域,将第二目标图像块中的内容与第一目标图像块中的内容融合。
-
公开(公告)号:CN115147850B
公开(公告)日:2023-05-05
申请号:CN202210777263.8
申请日:2022-06-30
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/19 , G06V30/148 , G06V10/26 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本公开提供了文字生成模型的训练方法、文字生成方法及其装置,涉及人工智能技术领域,尤其涉及深度学习、图像处理、计算机视觉技术领域,该方法包括:获取多个训练文字对,其中,任一训练文字对中包括第一字体下的样本文字,和样本文字对应的第二字体下的参考文字;对样本文字进行分割,获取样本文字的N个组成元素;根据样本文字和N个组成元素获取融合特征表示,以及获取参考文字的第一特征表示;基于融合特征表示和第一特征表示对文字生成模型进行训练,以获取目标文字生成模型。本申请实施例可以捕捉字体中的部首信息进行学习,可以实现文字生成效果的优化,提高生成字体的效率的同时,也提高了字体生成的准确率。
-
公开(公告)号:CN114051105B
公开(公告)日:2023-03-10
申请号:CN202111320124.4
申请日:2021-11-09
Applicant: 北京百度网讯科技有限公司
IPC: H04N5/265 , H04N5/262 , G10L13/047 , G10L21/10 , G06V40/16
Abstract: 本公开提供了多媒体数据处理方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及深度学习、计算机视觉等领域。具体实现方案为:根据参考视频数据中的参考音频数据,获得合成音频数据;将所述合成音频数据与所述参考音频数据进行映射,获得映射结果;根据所述映射结果,以及所述参考音频数据和所述参考视频数据的视频数据帧之间的映射关系,生成合成视频数据,所述合成视频数据中的音频数据为所述合成音频数据。本公开实施例能够为语音驱动人脸技术的使用和改进提供高度匹配的素材。
-
公开(公告)号:CN112887789B
公开(公告)日:2023-02-21
申请号:CN202110088850.1
申请日:2021-01-22
Applicant: 北京百度网讯科技有限公司
IPC: H04N21/44 , H04N21/472 , G06N20/00
Abstract: 本申请公开了一种视频生成模型的构建和视频生成方法、装置、设备及介质,涉及计算机技术领域,尤其涉及深度学习、计算机视觉和语音技术等人工智能技术领域。具体实现方案为:将样本人物图像和样本语音片段输入初始模型的编码器网络,得到图像特征和语音动作关联特征,将图像特征和语音动作关联特征输入初始模型的解码器网络,预测样本语音片段驱动样本人物图像的人物图像序列,并将语音动作关联特征输入初始模型的音素预测网络,预测样本语音片段的音素信息;根据样本语音片段的音素标签、样本语音片段关联的样本视频帧序列、音素信息和人物图像序列,对初始模型进行训练,得到视频生成模型。为图像驱动技术的发展提供了一种新思路。
-
-
-
-
-
-
-
-
-