-
公开(公告)号:CN111861955B
公开(公告)日:2024-11-19
申请号:CN202010576505.8
申请日:2020-06-22
Applicant: 北京百度网讯科技有限公司
IPC: G06T11/60 , G06T5/50 , G06T7/11 , G06T7/194 , G06V10/26 , G06V20/70 , G06V10/82 , G06N3/0464 , G06N3/044 , G06N3/045 , G06N3/0475 , G06N3/094
Abstract: 本申请公开了一种构建图像编辑模型的方法、装置、电子设备和计算机可读存储介质,涉及图像处理、深度学习技术领域。本申请在构建图像编辑模型时所采用的实现方案为:获取训练样本,所述训练样本中包含第一图像及其对应的第二图像;构建包含生成器与判别器的生成对抗网络,其中所述生成器包含背景图像生成分支、掩码图像生成分支以及前景图像生成分支;根据第一图像及其对应的第二图像训练所述生成对抗网络,将训练得到的所述生成对抗网络中的生成器作为图像编辑模型。本申请所构建的图像编辑模型能够对生成图像的缺失背景进行填补,从而提升所构建的图像编辑模型的编辑性能。
-
公开(公告)号:CN111709470B
公开(公告)日:2023-10-03
申请号:CN202010514466.9
申请日:2020-06-08
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/82 , G06V10/764 , G06V40/16 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/088 , G06N3/0475 , G06N3/09 , G06N3/094 , G06N20/10
Abstract: 本申请公开了图像生成方法、装置、设备及介质,涉及人工智能深度学习和图像处理领域。具体实现方案为:获取第一随机向量集合;基于经训练的分类器,确定所述第一随机向量集合中的至少一个随机向量所属的图像类别;将属于所述图像类别的随机向量输入至经训练的图像生成器,生成属于所述图像类别的虚拟图像。通过本申请的技术方案,能够自动生成大量具有明确分类的图像,提高图像多样性,降低图像分类成本。
-
公开(公告)号:CN112101204A
公开(公告)日:2020-12-18
申请号:CN202010965427.0
申请日:2020-09-14
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了一种生成式对抗网络的训练方法,涉及机器学习、计算机视觉和人脸识别技术领域。具体实现方案为:获取多组图像集,其中,多组图像集中的每组图像集具有各自的年龄段信息,每组图像集中的每个图像包括面部信息,面部信息的年龄信息属于与每组图像集对应的年龄段;以及基于多组图像集和多组图像集各自的年龄段信息,对预先构建的初始网络模型进行训练,得到经训练的生成式对抗网络。本申请还公开了一种生成式对抗网络的训练装置、图像处理方法和装置、电子设备和存储介质。
-
公开(公告)号:CN112053315A
公开(公告)日:2020-12-08
申请号:CN202010962811.5
申请日:2020-09-14
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了用于处理人物形象数据的方法和装置,涉及计算机视觉和深度学习技术领域。具体实施方式包括:获取第一人物的人物形象视频,作为第一数据,并获取第二人物的人物形象视频,作为第二数据,其中,该人物形象视频中具有包括头像动态形象的动态形象,该第一人物的人物形象视频中具有多种动态形象;提取第一人物的头像和第二人物的头像;利用头像更换模型,以该第二人物的头像更换该第一人物的头像,得到更换后头像。本申请可以通过换头操作,以使换头后头像具有不同头像的不同特点,以实现对两个头像进行有机的结合。并且,利用动态形象丰富的第一人物进行结合,可以弥补第二人物动态形象丰富度不足的问题。
-
公开(公告)号:CN112101204B
公开(公告)日:2024-01-23
申请号:CN202010965427.0
申请日:2020-09-14
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/82 , G06V40/16 , G06N3/0475 , G06N3/0464 , G06N3/094
Abstract: 本申请公开了一种生成式对抗网络的训练方法,涉及机器学习、计算机视觉和人脸识别技术领域。具体实现方案为:获取多组图像集,其中,多组图像集中的每组图像集具有各自的年龄段信息,每组图像集中的每个图像包括面部信息,面部信息的年龄信息属于与每组图像集对应的年龄段;以及基于多组图像集和多组图像集各自的年龄段信息,对预先构建的初始网络模型进行训练,得到经训练的生成式对抗网络。本申请还公开了一种生成式对抗网络的训练装置、图像处理方法和装置、电子设备和存储介质。
-
公开(公告)号:CN115375802B
公开(公告)日:2023-07-14
申请号:CN202210690069.6
申请日:2022-06-17
Applicant: 北京百度网讯科技有限公司
IPC: G06T13/00 , G06T7/269 , G06T5/00 , G06V40/16 , G06V40/10 , G06V10/46 , G06V10/74 , G06V10/82 , G06N3/0464 , G06N3/047 , G06N3/08
Abstract: 本公开提供了动态图像的生成方法、装置、存储介质及电子设备,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于人脸图像处理和人脸识别等场景。具体实现方案为:获取源视频包含的第一对象的第一关键点,以及目标图像包含的第二对象的第二关键点;基于第一关键点以及第二关键点确定中立关键点的第一运动轨迹,中立关键点表征以下至少一项:不同对象展现不同人脸表情时相同的人脸特征、不同对象进行不同肢体动作时相同的人体特征;将第一运动轨迹映射在目标图像上,得到运动光流信息;基于运动光流信息对第二对象进行驱动,生成目标动态图。
-
公开(公告)号:CN111861955A
公开(公告)日:2020-10-30
申请号:CN202010576505.8
申请日:2020-06-22
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了一种构建图像编辑模型的方法、装置、电子设备和计算机可读存储介质,涉及图像处理、深度学习技术领域。本申请在构建图像编辑模型时所采用的实现方案为:获取训练样本,所述训练样本中包含第一图像及其对应的第二图像;构建包含生成器与判别器的生成对抗网络,其中所述生成器包含背景图像生成分支、掩码图像生成分支以及前景图像生成分支;根据第一图像及其对应的第二图像训练所述生成对抗网络,将训练得到的所述生成对抗网络中的生成器作为图像编辑模型。本申请所构建的图像编辑模型能够对生成图像的缺失背景进行填补,从而提升所构建的图像编辑模型的编辑性能。
-
公开(公告)号:CN112017140B
公开(公告)日:2024-04-12
申请号:CN202010963667.7
申请日:2020-09-14
Applicant: 北京百度网讯科技有限公司
IPC: G06T5/50
Abstract: 本申请公开了用于处理人物形象数据的方法和装置,涉及计算机视觉和深度学习技术领域。具体实施方式包括:获取第一人物的人物形象视频,作为第一数据,并获取第二人物的人物形象视频,作为第二数据,第一人物的人物形象视频中具有多种动态形象;以从第二数据中提取的头像,更换从第一数据中提取的头像;以从第二数据中提取的人脸,更换从第一数据中提取的人脸;以更换后人脸更换更换后头像中的人脸,得到目标头像。本申请通过换头操作,让换头后头像具有不同头像的不同特点。并且,利用动态形象丰富的第一人物进行结合,可以弥补第二人物动态形象丰富度不足的问题。此外,针对人脸进行的换脸操作,可以有效提高更换后头像中人脸的清晰度。
-
公开(公告)号:CN115759252A
公开(公告)日:2023-03-07
申请号:CN202211243104.6
申请日:2020-06-12
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了一种深度学习推理引擎的调度方法、装置、设备和介质,涉及人工智能、深度学习和芯片技术。具体实现方案为:响应于来自应用层的针对当前推理任务的调度请求,确定所述当前推理任务的类型;计算每个推理引擎执行所述类型的当前推理任务后的总负载;比较所述每个推理引擎的总负载,根据比较结果从所述每个推理引擎中确定执行所述当前推理任务的目标推理引擎;将所述目标推理引擎的索引返回至所述应用层,其中,所述索引表示推理引擎的调用路径。本申请实施例能根据各推理引擎实际的算力来分配推理引擎,从而提高系统性能。并且,在推理引擎应用于人脸识别时,能提高人脸识别的速度和执行效率。
-
公开(公告)号:CN115375802A
公开(公告)日:2022-11-22
申请号:CN202210690069.6
申请日:2022-06-17
Applicant: 北京百度网讯科技有限公司
IPC: G06T13/00 , G06T7/269 , G06T5/00 , G06V40/16 , G06V40/10 , G06V10/46 , G06V10/74 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本公开提供了动态图像的生成方法、装置、存储介质及电子设备,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于人脸图像处理和人脸识别等场景。具体实现方案为:获取源视频包含的第一对象的第一关键点,以及目标图像包含的第二对象的第二关键点;基于第一关键点以及第二关键点确定中立关键点的第一运动轨迹,中立关键点表征以下至少一项:不同对象展现不同人脸表情时相同的人脸特征、不同对象进行不同肢体动作时相同的人体特征;将第一运动轨迹映射在目标图像上,得到运动光流信息;基于运动光流信息对第二对象进行驱动,生成目标动态图。
-
-
-
-
-
-
-
-
-