-
公开(公告)号:CN113642428B
公开(公告)日:2022-09-27
申请号:CN202110865025.8
申请日:2021-07-29
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种人脸活体检测方法、装置、电子设备及存储介质,涉及图像处理技术领域,具体涉及计算机视觉和深度学习等人工智能技术领域。具体实施方案为,获取待检测的包含人脸的源图像;基于源图像,获取每个检测模型的检测图像,其中,检测模型包括活体检测主模型和至少一个因子检测辅模型,因子检测辅模型用于对活体检测中的一个防攻击因子进行检测;获取活体检测主模型的第一检测概率和因子检测辅模型的第二检测概率;根据第一检测概率和第二检测概率,确定活体检测结果。由此,能够提高人脸活体检测的准确度和泛化性。
-
公开(公告)号:CN113989899A
公开(公告)日:2022-01-28
申请号:CN202111315762.7
申请日:2021-11-08
Applicant: 北京百度网讯科技有限公司
IPC: G06V40/16 , G06V10/762 , G06V10/774 , G06K9/62
Abstract: 本公开提供了一种人脸识别模型中特征提取层的确定方法、设备和存储介质,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域。具体实现方案为:通过目标网络模型中的两个分支对同一个对象的两个人脸样本图像进行分析,以得到两个人脸样本图像的聚类结果向量,并基于所得到的聚类结果向量对目标网络模型进行训练,以得到训练好的目标网络模型,以及将训练好的目标网络模型中第一分支中的特征提取层确定出人脸识别模型的特征提取层。由此,提供了一种人脸识别模型的特征提取层的获取方式。
-
公开(公告)号:CN113361455A
公开(公告)日:2021-09-07
申请号:CN202110720004.7
申请日:2021-06-28
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了人脸鉴伪模型的训练方法、装置、电子设备、存储介质及计算机程序产品,涉及人工智能领域,具体涉及计算机视觉和深度学习技术,可应用于人脸识别等场景。方法的一具体实施方式包括:执行如下训练操作,直至达到预设结束条件:获取相对应的真实人脸图像和合成人脸图像;通过噪声添加网络在合成人脸图像中添加噪声,得到人脸噪声图像,并通过判别网络识别真实人脸图像和人脸噪声图像中的人脸对象的真实性,以采用对抗方式训练噪声添加网络和判别网络;将训练后的判别网络确定为人脸鉴伪模型。本公开提高了人脸鉴伪模型的泛化能力和鲁棒性。
-
公开(公告)号:CN111950348A
公开(公告)日:2020-11-17
申请号:CN202010604996.2
申请日:2020-06-29
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了安全带的佩戴状态识别方法、装置、电子设备和存储介质,涉及计算机视觉、人工智能、深度学习领域。实现方案为:通过对交通工具监测得到的监测图像进行人脸识别,以得到人脸区域,并根据人脸区域的尺寸和位置,从监测图像中确定目标区域,继而根据目标区域的图像特征,识别安全带的佩戴状态。该方案通过预估安全带的佩戴区域,本申请中记为目标区域,仅对该目标区域进行安全带的佩戴状态识别,有效地减少了监测图像中其他无用信息的干扰,可以降低计算量,提升识别速率,可以应用于计算能力较低的设备中,比如车载设备中,提升该方法的适用性。
-
公开(公告)号:CN119558354A
公开(公告)日:2025-03-04
申请号:CN202411606779.1
申请日:2024-11-11
Applicant: 北京百度网讯科技有限公司
IPC: G06N3/0455 , G06N3/08 , G06T13/40
Abstract: 本公开提供了一种数字人驱动模型的构建、数字人驱动方法、装置、设备、介质及程序产品,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习以及大模型等技术领域,可应用于AIGC以及数字人等场景。具体实现方案为:获取原始样本;在原始样本的动作帧序列中,按照随机遮掩规则对设定数量的动作帧进行遮掩,得到遮掩动作帧序列;将遮掩动作帧序列加入至原始样本中,形成训练样本;使用训练样本对初始动作模型进行训练,得到数字人驱动模型。
-
公开(公告)号:CN119444977A
公开(公告)日:2025-02-14
申请号:CN202411336634.4
申请日:2024-09-24
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了基于大模型的虚拟形象生成方法、装置、智能体、电子设备及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于AIGC、数字人、智能电商等场景。该方法包括:利用大模型处理包括目标对象的目标图像,得到对象描述信息,目标对象具有纹理信息;利用纹理生成式大模型处理目标图像和表征三维对象的对象形态的待处理图像,得到具有目标纹理信息的目标三维对象,三维对象是基于对象描述信息确定的,目标纹理信息与纹理信息相匹配;以及基于目标三维对象生成虚拟形象。
-
公开(公告)号:CN115937993B
公开(公告)日:2024-09-24
申请号:CN202211610370.8
申请日:2022-12-14
Applicant: 北京百度网讯科技有限公司
IPC: G06V40/40 , G06V40/16 , G06V10/764 , G06V10/82 , G06N3/08
Abstract: 本公开提供了一种活体检测模型训练方法、活体检测方法、装置和电子设备,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域。该方法包括:通过活体检测模型中的特征提取网络对样本图像中的样本人脸区域进行特征提取得到样本人脸特征;通过动态路由网络根据样本人脸特征从至少两个候选活体检测网络中选择目标活体检测网络;通过目标活体检测网络根据样本人脸特征确定样本图像的预测活体信息;根据目标活体检测网络、预测活体信息、样本图像的标注攻击类型和样本图像的标注活体信息,对特征提取网络、动态路由网络和目标活体检测网络进行训练。通过上述技术方案能够提高活体检测的准确性。
-
公开(公告)号:CN118229815A
公开(公告)日:2024-06-21
申请号:CN202410317079.4
申请日:2024-03-19
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种视频生成方法,涉及人工智能技术领域,尤其涉及深度学习和计算机视觉技术领域,可应用于人工智能视频生成场景。具体实现方案为:基于图像特征、文本特征、以及图像中目标对象的动作特征,生成目标对象的动作序列;确定动作序列的运动控制特征,运动控制特征用于控制所生成的视频中的目标对象的动作与动作序列一致;以及基于图像特征、文本特征以及运动控制特征,生成目标视频。本公开还提供了一种深度学习模型的训练方法、装置、电子设备和存储介质。
-
公开(公告)号:CN115482395A
公开(公告)日:2022-12-16
申请号:CN202211219250.5
申请日:2022-09-30
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种深度学习模型的训练方法,涉及人工智能技术领域,尤其涉及深度学习、图像处理、计算机视觉等技术领域,可应用于人脸识别场景下。具体实现方案为:根据样本图像的第一特征和第一深度学习模型的第一分类网络的权重信息,确定注意力特征,其中,第一特征是利用第一深度学习模型的第一特征提取网络处理样本图像得到的;将注意力特征输入第一分类网络,得到注意力增强后的分类结果;以及根据注意力增强后的分类结果,训练第二深度学习模型。本公开还提供了一种深度学习模型的训练方法、图像分类方法、装置、电子设备和存储介质。
-
公开(公告)号:CN114155589A
公开(公告)日:2022-03-08
申请号:CN202111448404.3
申请日:2021-11-30
Applicant: 北京百度网讯科技有限公司
IPC: G06V40/16 , G06K9/62 , G06V10/762
Abstract: 本公开提供了一种图像处理方法、装置、设备以及存储介质,涉及人工智能技术领域,具体涉及深度学习、计算机视觉技术领域,可用于人脸识别场景。具体实现方案为:从待处理图像中选择目标图像;目标图像为采用人脸识别任务成功提取人脸信息的待处理图像;提取目标图像的人脸特征,并对人脸特征进行聚类;根据聚类结果,确定目标图像中的异常图像。能够在人脸识别的过程中自动收集容易误识别的异常图像。
-
-
-
-
-
-
-
-
-