-
公开(公告)号:CN118397328A
公开(公告)日:2024-07-26
申请号:CN202410316761.1
申请日:2024-03-19
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/08
Abstract: 本公开提供了图像分类模型的优化方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等领域,可应用于图像处理、人工智能内容生成等场景。具体实现方案为:将文本编码器中可学习的第一提示信息通过可学习的投影函数映射为图像编码器的第二提示信息,以基于文本编码器和图像编码器确定目标图像的预测类别;其中,文本编码器处理目标图像的文本信息;图像编码器用于处理目标图像;基于目标图像的预测类别和目标图像的真实类别,确定损失值;在固定文本编码器和图像编码器的模型参数的情况下,基于损失值,优化第一提示信息和投影函数,以得到适应目标分类任务的图像分类模型。
-
公开(公告)号:CN118196863A
公开(公告)日:2024-06-14
申请号:CN202410324535.8
申请日:2024-03-20
Applicant: 北京百度网讯科技有限公司
IPC: G06V40/16 , G06V40/40 , G06V10/774 , G06V10/764 , G06V10/75
Abstract: 本公开提供了一种活体检测模型训练方法和装置,涉及人工智能技术领域,具体涉及计算机视觉、深度学习、大模型等技术领域,可应用于人工智能的内容生成等场景。具体实现方案为:获取图像样本集;获取初始的活体检测模型,活体检测模型包括:特征识别子网络基于输入的图像,得到图文匹配特征;将从图像样本集中选取的图像样本输入特征识别子网络,得到图像语义识别子网络输出的图像描述文本和分类子网络输出的活体检测结果;基于图像描述文本和活体检测结果,计算活体检测模型的网络损失值;基于活体检测模型的网络损失值,训练活体检测模型,得到训练后的活体检测模型。
-
公开(公告)号:CN117746515A
公开(公告)日:2024-03-22
申请号:CN202311766228.7
申请日:2023-12-20
Applicant: 北京百度网讯科技有限公司
IPC: G06V40/40 , G06V10/774 , G06V40/16
Abstract: 本公开提供了一种检测模型的训练方法、检测方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、人脸识别等技术领域,可应用于智慧城市、智慧金融等场景。具体实现方案为:利用RGB人脸图像的训练数据集,训练得到用于检测人脸合成图的预训练模型,其中,所述预训练模型包括嵌入层、主干网络和分类层;获取所述RGB人脸图像对应的频域人脸图像,得到频域人脸图像的训练数据集;在所述主干网络中插入可学习的指令微调参数,利用所述频域人脸图像的训练数据集对插入所述指令微调参数的预训练模型进行指令微调,得到人脸合成图检测模型。
-
公开(公告)号:CN115546510A
公开(公告)日:2022-12-30
申请号:CN202211351224.8
申请日:2022-10-31
Applicant: 北京百度网讯科技有限公司
Inventor: 张国生
IPC: G06V10/44 , G06V10/762 , G06V10/764 , G06V10/774 , G06V40/16 , G06V40/40
Abstract: 本公开提供了一种图像检测方法和图像检测模型训练的方法,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于人脸识别、活体检测等场景。实现方案为:获得目标图像,目标图像对应于多个类别中的一个类别,多个类别中的每一个类别具有相应的聚类中心,聚类中心是基于与该类别对应的多个图像的多个图像特征获得的;基于目标图像,获得目标图像的图像特征,图像特征指示多个类别中的一个类别;以及基于目标图像的图像特征和多个类别中的至少目标类别对应的聚类中心,获得目标图像的检测结果,检测结果指示目标图像是否对应于目标类别。
-
公开(公告)号:CN115171225A
公开(公告)日:2022-10-11
申请号:CN202210771396.4
申请日:2022-06-30
Applicant: 北京百度网讯科技有限公司
Inventor: 张国生
IPC: G06V40/40 , G06V10/40 , G06V10/764 , G06V10/774
Abstract: 本公开提供了一种图像检测方法、图像检测模型的训练方法、装置、设备、存储介质以及计算机程序产品,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于活体检测等场景。具体实现方案为:获取待检测图像;从待检测图像中提取至少两个不同特征尺度的图像特征;对图像特征进行尺度组合,确定目标图像特征;对目标图像特征进行图像分类,得到检测结果。提高了检测准确率。
-
公开(公告)号:CN115147902A
公开(公告)日:2022-10-04
申请号:CN202210782050.4
申请日:2022-06-30
Applicant: 北京百度网讯科技有限公司
Inventor: 张国生
Abstract: 本公开提供了一种人脸活体检测模型的训练方法、装置、电子设备、存储介质及计算机程序产品,涉及人工智能技术领域,具体涉及深度学习、图像处理、计算机视觉技术领域,用于人脸活体检测场景。具体实现方案为:获取训练样本集;根据样本人脸图像,得到至少两个不同的同源图像;通过特征提取网络分别对至少两个不同的同源图像进行特征提取,得到至少两个第一特征数据;通过回归网络对至少两个第一特征数据进行处理,得到至少两个第二特征数据;根据至少两个第一特征数据获取第一损失;根据第二特征数据和标签获取第二损失;根据第一损失和第二损失,训练人脸活体检测模型。本公开提高了人脸活体检测模型的鲁棒性和准确度。
-
公开(公告)号:CN113361455B
公开(公告)日:2022-09-02
申请号:CN202110720004.7
申请日:2021-06-28
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了人脸鉴伪模型的训练方法、装置、电子设备、存储介质及计算机程序产品,涉及人工智能领域,具体涉及计算机视觉和深度学习技术,可应用于人脸识别等场景。方法的一具体实施方式包括:执行如下训练操作,直至达到预设结束条件:获取相对应的真实人脸图像和合成人脸图像;通过噪声添加网络在合成人脸图像中添加噪声,得到人脸噪声图像,并通过判别网络识别真实人脸图像和人脸噪声图像中的人脸对象的真实性,以采用对抗方式训练噪声添加网络和判别网络;将训练后的判别网络确定为人脸鉴伪模型。本公开提高了人脸鉴伪模型的泛化能力和鲁棒性。
-
公开(公告)号:CN113869449A
公开(公告)日:2021-12-31
申请号:CN202111182609.1
申请日:2021-10-11
Applicant: 北京百度网讯科技有限公司
Inventor: 张国生
Abstract: 本公开提供了一种模型训练、图像处理方法、装置、设备及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术领域,可应用于人脸图像处理和人脸识别等场景。具体实现方案为:获得第一样本图像,对第一样本图像进行第一数据增广处理得到多个第二样本图像;获得对初始神经网络模型进行训练后得到的待训练模型;采用待训练模型对各第二样本图像进行处理,得到第一处理结果和第一置信度;根据所得第一处理结果确定第一样本图像的第一标注信息;对第一样本图像进行第二数据增广处理得到多个第三样本图像;使用各第三样本图像和第一标注信息对待训练模型进行训练,得到训练后的模型。应用本公开提供的方案能够实现模型训练。
-
公开(公告)号:CN118657988A
公开(公告)日:2024-09-17
申请号:CN202410737718.2
申请日:2024-06-07
Applicant: 北京百度网讯科技有限公司
Inventor: 张国生
IPC: G06V10/764 , G06V10/44 , G06T11/00 , G06V40/40 , G06V40/16 , G06V10/82 , G06N3/0464 , G06N3/047 , G06N3/084 , G06N3/09 , G06V40/10
Abstract: 本公开提供了一种图像检测模型训练及图像检测方法、装置、设备和存储介质,涉及人工智能技术领域,具体涉及计算机视觉、深度学习等技术领域,可应用于智慧城市、智慧工业等场景。图像检测模型包括:特征提取网络和分类网络,图像检测模型的训练方法包括:采用特征提取网络,对所述样本图像进行特征提取处理,以获得图像特征;对图像特征进行生成处理,以获得生成图像;采用分类网络,对图像特征进行分类处理,以获得类别预测值;基于生成图像和线索图像,以及类别预测值,构建总损失函数;所述线索图像是基于样本图像生成的,用于表征至少一个维度的预设线索;采用总损失函数,调整特征提取网络的模型参数和分类网络的模型参数。
-
公开(公告)号:CN117197904B
公开(公告)日:2024-09-17
申请号:CN202310339456.X
申请日:2023-03-31
Applicant: 北京百度网讯科技有限公司
IPC: G06V40/40 , G06V40/16 , G06V10/774 , G06V10/74 , G06V10/25 , G06F40/289 , G06V10/82 , G06N3/08 , G06N3/047 , G06N3/048 , G06N3/0455
Abstract: 本公开提供了人脸活体检测模型的训练方法、人脸活体检测方法及装置,涉及人工智能技术领域,尤其涉及图像处理、计算机视觉等技术领域,具体涉及人脸活体检测模型的训练方法及装置、人脸活体检测方法及装置、电子设备、存储介质和计算机程序产品。具体实现方案为:基于人脸活体检测模型从各样本图像中提取出人脸特征,并确定人脸活体检测结果;从各样本图像的文本描述中提取出文本特征;该人脸特征和文本特征用于构建样本对,基于多个样本对中人脸特征和文本特征之间的对比损失,以及人脸活体检测结果和标注结果之间的分类损失,确定总损失值;基于总损失值调整人脸活体检测模型。本公开实施例能够提高人脸活体检测模型的泛化性和精度。
-
-
-
-
-
-
-
-
-