-
公开(公告)号:CN117197904B
公开(公告)日:2024-09-17
申请号:CN202310339456.X
申请日:2023-03-31
Applicant: 北京百度网讯科技有限公司
IPC: G06V40/40 , G06V40/16 , G06V10/774 , G06V10/74 , G06V10/25 , G06F40/289 , G06V10/82 , G06N3/08 , G06N3/047 , G06N3/048 , G06N3/0455
Abstract: 本公开提供了人脸活体检测模型的训练方法、人脸活体检测方法及装置,涉及人工智能技术领域,尤其涉及图像处理、计算机视觉等技术领域,具体涉及人脸活体检测模型的训练方法及装置、人脸活体检测方法及装置、电子设备、存储介质和计算机程序产品。具体实现方案为:基于人脸活体检测模型从各样本图像中提取出人脸特征,并确定人脸活体检测结果;从各样本图像的文本描述中提取出文本特征;该人脸特征和文本特征用于构建样本对,基于多个样本对中人脸特征和文本特征之间的对比损失,以及人脸活体检测结果和标注结果之间的分类损失,确定总损失值;基于总损失值调整人脸活体检测模型。本公开实施例能够提高人脸活体检测模型的泛化性和精度。
-
公开(公告)号:CN116611477B
公开(公告)日:2024-05-17
申请号:CN202310638785.4
申请日:2023-05-31
Applicant: 北京百度网讯科技有限公司
IPC: G06N3/0464 , G06N3/0455 , G06N3/082
Abstract: 本公开提供了一种数据剪枝方法和序列模型的训练方法、装置、设备和介质,涉及人工智能领域,具体涉及计算机视觉、自然语言处理和深度学习等技术领域,可应用于图像分类、OCR、文本抽取和问答系统等场景。数据剪枝方法包括:获取针对目标计算单元的输入标记序列;输入标记序列中的每个标记指示多媒体数据中一个数据单元的特征;根据设置于目标计算单元之前的注意力单元生成的注意力矩阵,对输入标记序列进行剪枝处理,得到剪枝后标记序列和被剪枝标记;将剪枝后标记序列输入目标计算单元,得到目标计算单元输出的计算后标记序列;以及组合计算后标记序列和被剪枝标记,得到设置于目标计算单元之后的在后计算单元的输入数据。
-
公开(公告)号:CN114445898B
公开(公告)日:2023-08-29
申请号:CN202210112290.3
申请日:2022-01-29
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了人脸活体检测方法、装置、设备、存储介质及程序产品,涉及人工智能领域,具体为深度学习、计算机视觉技术领域,可应用于人脸图像处理、人脸识别等场景。具体方案为:获取颜色序列验证码,控制终端根据颜色序列验证码依次显示颜色,获取终端采集的在依次显示对应颜色过程中目标对象的面部视频;从面部视频中提取各颜色通道颜色强度序列的第一微分信号,根据各颜色通道对应的第一微分信号获取表征各颜色通道色差的第二微分信号;根据各颜色通道对应的第二微分信号,获取面部视频中的颜色序列;若面部视频中的颜色序列与颜色序列验证码匹配,确定未受到注入攻击,并根据面部视频进行人脸活体检测。可防止人脸活体检测过程中的注入攻击。
-
公开(公告)号:CN115761839A
公开(公告)日:2023-03-07
申请号:CN202211296157.4
申请日:2022-10-21
Applicant: 北京百度网讯科技有限公司
IPC: G06V40/16 , G06V40/40 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/09
Abstract: 本公开提供了人脸活体检测模型的训练方法、人脸活体检测方法及装置,涉及人工智能技术领域,尤其涉及涉及深度学习、图像处理、计算机视觉技术领域。具体实现方案为:根据样本人脸图像,确定第一模型输出的第一特征;根据第一特征,利用第一损失函数,确定第一损失值;根据第一特征和样本人脸图像对应的第一文本描述,确定第二模型输出的第二特征;根据第二特征,利用第二损失函数,确定第二损失值;以及根据第一损失值和第二损失值,对第一模型进行训练,以得到人脸活体检测模型。本公开实施例中,通过图像模态和文本模态监督模型训练,利用文本模态提供的细粒度语义信息的监督,提升人脸活体检测模型的泛化性。
-
公开(公告)号:CN115359574A
公开(公告)日:2022-11-18
申请号:CN202210834250.X
申请日:2022-07-14
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种人脸活体检测及相应模型的训练方法、装置及存储介质。涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于人脸识别等场景。具体实现方案为:对待检测人脸图像进行预处理,获取目标人脸图像;所述目标人脸图像中人脸区域的占比大于所述待检测人脸图像中人脸区域的占比;获取所述目标人脸图像的全局特征;基于全局特征和预建立的特征库,对所述待检测人脸图像进行人脸活体检测。本公开的技术,能够有效地提高人脸活体检测的准确性。
-
公开(公告)号:CN113642428B
公开(公告)日:2022-09-27
申请号:CN202110865025.8
申请日:2021-07-29
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种人脸活体检测方法、装置、电子设备及存储介质,涉及图像处理技术领域,具体涉及计算机视觉和深度学习等人工智能技术领域。具体实施方案为,获取待检测的包含人脸的源图像;基于源图像,获取每个检测模型的检测图像,其中,检测模型包括活体检测主模型和至少一个因子检测辅模型,因子检测辅模型用于对活体检测中的一个防攻击因子进行检测;获取活体检测主模型的第一检测概率和因子检测辅模型的第二检测概率;根据第一检测概率和第二检测概率,确定活体检测结果。由此,能够提高人脸活体检测的准确度和泛化性。
-
公开(公告)号:CN114820467A
公开(公告)日:2022-07-29
申请号:CN202210359406.3
申请日:2022-04-07
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种合成图像识别方法及装置、图像识别模型训练方法及装置,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于人脸识别等场景。具体实现方案为:获取训练数据,其中,训练数据中包括训练图像、训练图像对应的训练标签,训练标签用于指示训练图像是否为合成图像。根据图像识别模型中的特征提取层对训练图像进行处理,得到训练图像的目标特征矩阵。根据目标特征矩阵,确定训练图像的预测标签。根据预测标签和训练标签,对图像识别模型的模型参数进行更新。本公开的技术方案可以有效提升图像识别模型的处理泛化性,进而提升合成图像识别的正确性。
-
公开(公告)号:CN113361455A
公开(公告)日:2021-09-07
申请号:CN202110720004.7
申请日:2021-06-28
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了人脸鉴伪模型的训练方法、装置、电子设备、存储介质及计算机程序产品,涉及人工智能领域,具体涉及计算机视觉和深度学习技术,可应用于人脸识别等场景。方法的一具体实施方式包括:执行如下训练操作,直至达到预设结束条件:获取相对应的真实人脸图像和合成人脸图像;通过噪声添加网络在合成人脸图像中添加噪声,得到人脸噪声图像,并通过判别网络识别真实人脸图像和人脸噪声图像中的人脸对象的真实性,以采用对抗方式训练噪声添加网络和判别网络;将训练后的判别网络确定为人脸鉴伪模型。本公开提高了人脸鉴伪模型的泛化能力和鲁棒性。
-
公开(公告)号:CN111950348A
公开(公告)日:2020-11-17
申请号:CN202010604996.2
申请日:2020-06-29
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了安全带的佩戴状态识别方法、装置、电子设备和存储介质,涉及计算机视觉、人工智能、深度学习领域。实现方案为:通过对交通工具监测得到的监测图像进行人脸识别,以得到人脸区域,并根据人脸区域的尺寸和位置,从监测图像中确定目标区域,继而根据目标区域的图像特征,识别安全带的佩戴状态。该方案通过预估安全带的佩戴区域,本申请中记为目标区域,仅对该目标区域进行安全带的佩戴状态识别,有效地减少了监测图像中其他无用信息的干扰,可以降低计算量,提升识别速率,可以应用于计算能力较低的设备中,比如车载设备中,提升该方法的适用性。
-
公开(公告)号:CN117612120B
公开(公告)日:2025-01-28
申请号:CN202311607432.4
申请日:2023-11-28
Applicant: 北京百度网讯科技有限公司
IPC: G06V20/56 , G06V10/764 , G06V10/80 , G06V10/44 , G06N3/0464 , G06N3/0455 , G06N3/088 , G06N3/0895 , G06N3/09
Abstract: 本公开提供了提示信息生成方法、对象识别方法、装置以及无人车,涉及人工智能技术领域,具体涉及计算机视觉、深度学习、大模型等技术领域,可应用于智能交通、自动驾驶等场景。具体实现方案为:对获取到的初始样本图像进行多类型图像属性转换,得到多个图像属性各自相关的样本图像,初始样本图像与待识别的样本对象相关,初始样本图像与表征样本对象的对象类别的标签相关联;获取用于描述样本对象的样本文本,以及与多个图像属性各自相关的初始提示信息;根据样本文本、多个样本图像和多个初始提示信息,确定样本对象识别结果;以及根据样本对象识别结果和标签更新多个初始提示信息,生成用于进行对象识别的多个提示信息。
-
-
-
-
-
-
-
-
-