-
公开(公告)号:CN114494935B
公开(公告)日:2024-01-05
申请号:CN202111539627.0
申请日:2021-12-15
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种视频信息的处理方法、一种用于鉴别伪造图像的神经网络模型的训练方法、装置、电子设备和介质,涉及人工智能技术领域,尤其涉及深度学习、计算机视觉技术领域,可应用于人脸识别、人脸检测等场景。实现方案为:对包括第一视频帧序列的待检测视频进行采样,以获取包括多个视频帧的第二视频帧序列;确定第二视频帧序列中的伪造视频帧;以及响应于确定第二视频帧序列中的第一视频帧为伪造视频帧,基于第一视频帧以及在第二视频帧序列中与第一视频帧相邻的第二视频帧,在第一视频帧序列中确定待检测视频中的伪造片段。
-
公开(公告)号:CN113971828B
公开(公告)日:2023-10-31
申请号:CN202111261314.3
申请日:2021-10-28
Applicant: 北京百度网讯科技有限公司
IPC: G06V40/16 , G06V10/774 , G06V10/766 , G06V10/74
Abstract: 本公开提供了一种虚拟对象唇形驱动方法、模型训练方法、相关装置及电子设备,涉及计算机视觉、深度学习等人工智能技术领域。具体实现方案为:获取语音片段和虚拟对象的目标脸部图像数据;将所述语音片段和所述目标脸部图像数据输入至第一目标模型执行第一唇形驱动操作,得到所述虚拟对象在所述语音片段驱动下的第一唇形图像数据;其中,所述第一目标模型基于第一模型和第二模型训练得到,所述第一模型为针对唇形图像数据的唇音同步判别模型,所述第二模型为针对唇形图像数据中唇部区域的唇音同步判别模型。
-
公开(公告)号:CN113140017B
公开(公告)日:2023-09-15
申请号:CN202110487527.1
申请日:2021-04-30
Applicant: 北京百度网讯科技有限公司
IPC: G06T11/00 , G06T11/20 , G06N3/0475 , G06N3/045
Abstract: 本公开公开了一种训练对抗网络模型的方法,涉及人工智能领域,尤其涉及计算机视觉和深度学习领域。具体实现方案为:对抗网络模型包括生成模型和判别模型,该方法包括:使用生成模型,基于具有基础字体的内容字样本和具有风格字体的风格字样本来产生生成字,并基于内容字样本来产生重构字;利用判别模型,基于生成字和重构字,来计算生成模型的基本损失;通过使用经训练的字符分类模型对生成字进行分类,来计算生成模型的字符损失;基于基本损失和字符损失来调整生成模型的参数。本公开还公开了一种训练对抗网络模型的装置、建立字库的方法和装置、电子设备和存储介质。
-
公开(公告)号:CN111695698B
公开(公告)日:2023-09-12
申请号:CN202010538343.9
申请日:2020-06-12
Applicant: 北京百度网讯科技有限公司
IPC: G06N3/096 , G06N3/0475 , G06N3/094 , G06N3/0464 , G06N3/0455 , G06V10/82 , G06V10/80
Abstract: 本申请实施例公开了一种用于模型蒸馏的方法、装置、电子设备及计算机可读存储介质,涉及人工智能、深度学习和图像处理技术领域。该方法的一具体实施方式包括:首先,基于预设的搜索空间设计规则构建得到搜索空间;然后,根据搜索空间初始化多特征融合方式生成器;接着,利用多特征融合方式生成器得到多个教师模型的融合特征;最后,基于融合特征对原始学生模型的原始特征进行模型蒸馏处理,得到目标学生模型。该实施方式在将教师模型的知识传递至学生模型时,引入了自动搜索技术中搜索空间的概念,得以利用设计好的搜索空间自动确定出最佳的融合特征生成方式和蒸馏策略,得以让教师模型的知识更加准确的传递至学生模型。
-
公开(公告)号:CN111291218B
公开(公告)日:2023-09-08
申请号:CN202010065820.4
申请日:2020-01-20
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了一种视频融合方法、装置、电子设备及可读存储介质,涉及计算机视觉技术。具体实现方案为根据用户视频的各视频帧图像和模板视频的各视频帧图像,获得用户视频的各视频帧图像中人脸图像的预测三维人脸网格;根据用户视频的各视频帧图像中人脸图像的用户三维人脸网格的用户纹理和模板视频的各视频帧图像中人脸图像的模板三维人脸网格的模板纹理,获得预测三维人脸网格的预测纹理;根据预测三维人脸网格、预测纹理和用户人脸姿态,以及模板人脸姿态,获得预测三维人脸网格的渲染人脸图像;对渲染人脸图像和模板视频的各视频帧图像进行融合处理,以获得融合之后的各融合视频帧图像,并对其进行合成处理获得融合视频。
-
公开(公告)号:CN115083000B
公开(公告)日:2023-09-05
申请号:CN202210832574.X
申请日:2022-07-14
Applicant: 北京百度网讯科技有限公司
IPC: G06V40/16 , G06V10/774 , G06T3/00
Abstract: 本公开提供了一种人脸模型训练方法、换脸方法、装置和电子设备,涉及图像处理技术领域,尤其涉及深度学习技术领域。具体实现方案为:人脸模型训练方法,包括:获取训练数据集,所述训练数据集包括第一训练数据,所述第一训练数据包括待换脸的相同对象的两张脸部图像和第一监督图像,所述两张脸部图像包括:处于侧脸姿态的第一脸部图像,所述第一监督图像包括所述第一脸部图像;基于所述训练数据集对初始换脸模型进行训练,得到训练后的目标换脸模型。本公开可以提高训练之后得到的模型对侧脸图像的换脸效果。
-
公开(公告)号:CN115375802B
公开(公告)日:2023-07-14
申请号:CN202210690069.6
申请日:2022-06-17
Applicant: 北京百度网讯科技有限公司
IPC: G06T13/00 , G06T7/269 , G06T5/00 , G06V40/16 , G06V40/10 , G06V10/46 , G06V10/74 , G06V10/82 , G06N3/0464 , G06N3/047 , G06N3/08
Abstract: 本公开提供了动态图像的生成方法、装置、存储介质及电子设备,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于人脸图像处理和人脸识别等场景。具体实现方案为:获取源视频包含的第一对象的第一关键点,以及目标图像包含的第二对象的第二关键点;基于第一关键点以及第二关键点确定中立关键点的第一运动轨迹,中立关键点表征以下至少一项:不同对象展现不同人脸表情时相同的人脸特征、不同对象进行不同肢体动作时相同的人体特征;将第一运动轨迹映射在目标图像上,得到运动光流信息;基于运动光流信息对第二对象进行驱动,生成目标动态图。
-
公开(公告)号:CN113536991B
公开(公告)日:2023-06-23
申请号:CN202110730128.3
申请日:2021-06-29
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/774 , G06V40/16 , G06V10/82 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/088
Abstract: 本公开公开一种训练集生成、人脸图像处理方法、装置及电子设备,涉及领域人工智能技术领域,尤其涉及计算机视觉和深度学习技术领域,可应用于人脸图像处理等场景。具体实现方案为:通过图像美学算法确定人脸图像数据集中每张人脸图像的美感得分;通过人脸质量评价算法确定人脸图像数据集中每张人脸图像的人脸质量得分;通过图像质量评估算法确定人脸图像数据集中每张人脸图像的自适应质量得分;确定每张人脸图像的综合得分;选取预设数量的人脸图像,以生成用于训练人脸属性编辑模型的训练集。可以生成高质量的训练集,提高人脸属性编辑模型编辑的人脸图像的美观度与自然度。
-
公开(公告)号:CN115147850A
公开(公告)日:2022-10-04
申请号:CN202210777263.8
申请日:2022-06-30
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/19 , G06V30/148 , G06V10/26 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本公开提供了文字生成模型的训练方法、文字生成方法及其装置,涉及人工智能技术领域,尤其涉及深度学习、图像处理、计算机视觉技术领域,该方法包括:获取多个训练文字对,其中,任一训练文字对中包括第一字体下的样本文字,和样本文字对应的第二字体下的参考文字;对样本文字进行分割,获取样本文字的N个组成元素;根据样本文字和N个组成元素获取融合特征表示,以及获取参考文字的第一特征表示;基于融合特征表示和第一特征表示对文字生成模型进行训练,以获取目标文字生成模型。本申请实施例可以捕捉字体中的部首信息进行学习,可以实现文字生成效果的优化,提高生成字体的效率的同时,也提高了字体生成的准确率。
-
公开(公告)号:CN110458781B
公开(公告)日:2022-07-19
申请号:CN201910750649.8
申请日:2019-08-14
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请实施例公开了用于处理图像的方法和装置。该方法的一具体实施方式包括:获取目标脸部图像和参考脸部图像;从目标脸部图像和参考脸部图像中分别分割出目标脸部区域和参考脸部区域;将目标脸部区域的颜色向参考脸部区域的颜色迁移,得到处理后的目标脸部区域;生成目标脸部图像的脸部掩膜矩阵;利用脸部掩膜矩阵对处理后的目标脸部区域和目标脸部图像进行融合,得到处理后的目标脸部图像。该实施方式提高了处理后的脸部图像的自然度。
-
-
-
-
-
-
-
-
-