-
公开(公告)号:CN107609462A
公开(公告)日:2018-01-19
申请号:CN201710596110.2
申请日:2017-07-20
Applicant: 北京百度网讯科技有限公司
IPC: G06K9/00
Abstract: 本发明公开了待检测信息生成及活体检测方法、装置、设备及存储介质,其中方法包括:获取用户的待检测信息,待检测信息中包括利用智能终端拍摄的人脸视频以及在拍摄人脸视频的过程中智能终端的运动信息,其中,在拍摄人脸视频的过程中,用户需要按照要求移动智能终端;根据待检测信息确定出人脸视频中的人脸是否为活体。应用本发明所述方案,能够提高检测结果的准确性等。
-
公开(公告)号:CN112489102B
公开(公告)日:2024-12-27
申请号:CN202011372419.1
申请日:2020-11-30
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了三维重建方法、装置、设备以及存储介质,涉及计算机视觉、深度学习等人工智能技术领域。该方法的一具体实施方式包括:获取目标的RGBD图像序列;对于RGBD图像序列中的RGBD图像,确定目标在RGBD图像上的第一三维关键点集合;将第一三维关键点集合转移到相机坐标系下,得到目标在相机坐标系下的第二三维关键点集合;基于第二三维关键点集合,计算RGBD图像的欧拉角;基于欧拉角选取RGBD图像;基于选取出的RGBD图像进行目标三维重建,得到目标的三维模型。该实施方式从RGBD图像序列中选取关键帧进行三维重建,能够在保证三维重建效果的情况下,节省存储与网络传输资源。
-
公开(公告)号:CN112966607B
公开(公告)日:2024-12-06
申请号:CN202110246125.2
申请日:2021-03-05
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了一种模型训练方法、人脸视频生成方法、装置、设备、介质和程序产品,涉及人工智能领域,尤其涉及计算机视觉和深度学习技术。具体实现方案为:将用于训练主模型的输入数据输入所述主模型,得到所述主模型的输出数据;利用预先训练的专家模型,根据所述输入数据和输出数据计算初始损失值;利用所述专家模型,计算所述输入数据及其对应的训练标注结果的匹配概率;将所述匹配概率与所述初始损失值进行融合,得到目标损失值,其中,所述目标损失值用于对所述主模型进行监督训练。本申请通过动态调整损失值,不论专家模型的表现是否足够好,都能提高模型训练的准确性。
-
公开(公告)号:CN111861955B
公开(公告)日:2024-11-19
申请号:CN202010576505.8
申请日:2020-06-22
Applicant: 北京百度网讯科技有限公司
IPC: G06T11/60 , G06T5/50 , G06T7/11 , G06T7/194 , G06V10/26 , G06V20/70 , G06V10/82 , G06N3/0464 , G06N3/044 , G06N3/045 , G06N3/0475 , G06N3/094
Abstract: 本申请公开了一种构建图像编辑模型的方法、装置、电子设备和计算机可读存储介质,涉及图像处理、深度学习技术领域。本申请在构建图像编辑模型时所采用的实现方案为:获取训练样本,所述训练样本中包含第一图像及其对应的第二图像;构建包含生成器与判别器的生成对抗网络,其中所述生成器包含背景图像生成分支、掩码图像生成分支以及前景图像生成分支;根据第一图像及其对应的第二图像训练所述生成对抗网络,将训练得到的所述生成对抗网络中的生成器作为图像编辑模型。本申请所构建的图像编辑模型能够对生成图像的缺失背景进行填补,从而提升所构建的图像编辑模型的编辑性能。
-
公开(公告)号:CN113378696B
公开(公告)日:2024-11-05
申请号:CN202110636583.7
申请日:2021-06-08
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了图像处理方法、装置、设备及存储介质,涉及人工智能技术领域,具体为计算机视觉、深度学习技术领域,可应用于图像处理场景下。具体实现方案为:从目标图像中获取人脸区域图像;将所述人脸区域图像输入目标模型,得到所述目标模型输出的至少一种类型的目标区域分别对应的分割结果;基于所述至少一种类型的目标区域分别对应的分割结果,确定所述人脸区域图像中所述至少一种类型的目标区域分别对应的子图像;在所述至少一种类型的目标区域分别对应的所述子图像中,确定所述至少一种类型的目标区域中分别包含的目标对象所对应的位置信息。本公开实施例能够保证检测至少一种类型的目标区域内包含的目标对象的位置信息的精确度。
-
公开(公告)号:CN112017141B
公开(公告)日:2024-06-04
申请号:CN202010963670.9
申请日:2020-09-14
Applicant: 北京百度网讯科技有限公司
IPC: G06T5/50
Abstract: 本申请公开了视频数据处理方法和装置,涉及计算机视觉和深度学习技术领域。具体实施方式包括:获取对第一人物的动态形象拍摄的视频,作为动态模板视频;利用目标图像中的第二人物的目标人脸,更换预设人物视频中的人脸,得到含目标视频,其中,含目标视频所包含人脸的属性形象为目标人脸的属性形象,含目标视频所包含人脸的动态形象为预设人物视频所包含的人脸的动态形象;以含目标视频中的头像,更换动态模板视频中的头像,得到头像更换视频。本申请可以利用将图像中人脸的属性,添加到可以构建虚拟形象的视频中,从而实现可以驱动包括该图像中人脸的属性的虚拟形象。此外,通过动态模板视频,有助于给虚拟形象添加丰富的动态形象。
-
公开(公告)号:CN114782708B
公开(公告)日:2024-04-16
申请号:CN202210518677.9
申请日:2022-05-12
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/44 , G06V10/46 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本公开提供了一种图像生成方法,涉及人工智能技术领域,尤其涉及深度学习、图像处理和计算机视觉技术领域。具体实现方案为:获取输入掩码信息和模板图像的第一特征图,其中,输入掩码信息是根据所述模板图像的第二特征图和源图像的标识信息得到的;根据输入掩码信息和模板图像的第一特征图,得到融合特征图;以及根据标识信息和融合特征图,进行图像生成。本公开还提供了一种图像生成模型的训练方法、装置、电子设备和存储介质。
-
公开(公告)号:CN112131988B
公开(公告)日:2024-03-26
申请号:CN202010962995.5
申请日:2020-09-14
Applicant: 北京百度网讯科技有限公司
IPC: G06V40/16 , G06V10/75 , G06V10/762 , G06V10/82 , G06N3/0464 , G06N3/049 , G06N3/08 , G10L13/02 , G10L21/10
Abstract: 本申请公开了一种确定虚拟人物唇形的方法、装置、设备和计算机存储介质,涉及人工智能技术,具体涉及计算机视觉和深度学习技术。具体实现方案为:确定语音对应的音素序列,所述音素序列中包括各时间点对应的音素;确定所述音素序列中各音素对应的唇形关键点信息;根据确定出的各唇形关键点信息,检索预先建立的唇形库,得到各音素的唇形图像;将检索到的各音素的唇形图像与所述各时间点相对应,得到所述语音对应的唇形图像序列。通过本申请能够实现语音和图像中唇形的同步。
-
公开(公告)号:CN114926322B
公开(公告)日:2024-03-15
申请号:CN202210526828.5
申请日:2022-05-12
Applicant: 北京百度网讯科技有限公司
IPC: G06T3/04 , G06V40/16 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本公开提供了一种图像生成方法,涉及人工智能技术领域,尤其涉及深度学习、图像处理和计算机视觉技术领域,可应用于人脸等场景。具体实现方案为:根据源图像的第一标识信息和样本图像,得到第一中间图像;根据第一中间图像和源图像之间的差异,调整第一标识信息,得到第二标识信息;以及根据第二标识信息和模板图像,进行图像生成。本公开还提供了一种图像生成装置、电子设备和存储介质。
-
公开(公告)号:CN113963087B
公开(公告)日:2023-10-27
申请号:CN202111189380.4
申请日:2021-10-12
Applicant: 北京百度网讯科技有限公司
IPC: G06T11/60 , G06N3/0475 , G06N3/09 , G06N3/0455 , G06N3/094
Abstract: 本申请公开了图像处理方法、图像处理模型训练方法、装置及存储介质,涉及人工智能领域的计算机视觉、深度学习等领域。具体实现方案为:将所述待编辑图像在生成对抗网络的S空间进行编码,获取第一隐编码;其中,所述生成对抗网络为基于样式的生成对抗网络;将所述文本描述信息进行编码,获取文本图像的文本编码,并将所述文本编码在所述S空间上进行映射,获取第二隐编码;将所述第一隐编码和第二隐编码进行距离优化,获取满足距离要求的目标隐编码;基于所述目标隐编码生成所述目标图像。能够在编辑图像的某一部分时对其它无需编辑的部分产生的影响更小;并能够有效提升优化速度。
-
-
-
-
-
-
-
-
-