-
公开(公告)号:CN114120074B
公开(公告)日:2023-12-12
申请号:CN202111306870.8
申请日:2021-11-05
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/80 , G06V10/764 , G06V10/82 , G06V10/74 , G06F40/30 , G06N3/0464 , G06N3/0442 , G06N3/0455 , G06N3/048 , G06N3/0895
Abstract: 根据本公开的实施例,提供了基于语义增强的图像识别模型的训练方法和装置、用于图像识别的方法和装置、电子设备以及计算机可读存储介质,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于图像处理、图像识别等场景。基于语义增强的图像识别模型的训练方法包括:从输入的未标注且无文字描述的第一图像中,提取第一图像的第一特征表示;基于第一特征表示,计算第一损失函数;从输入的未标注且具有原始文字描述的第二图像中,提取第二图像的第二特征表示;基于第二特征表示,计算第二损失函数;和基于第一损失函数和第二损失函数的融合,训练图像识别模型。以此方式,
-
公开(公告)号:CN111783647B
公开(公告)日:2023-11-03
申请号:CN202010615462.X
申请日:2020-06-30
Applicant: 北京百度网讯科技有限公司
IPC: G06V40/16 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0475 , G06N3/094
Abstract: 本申请公开了人脸融合模型的训练方法、人脸融合方法、装置及设备,涉及深度学习领域。具体实现方案为:获取样本图像,所述样本图像包括用户样本图像和底板样本图像;根据所述用户样本图像和底板样本图像对生成式对抗网络进行训练,得到人脸融合模型,所述人脸融合模型用于将底板图像中的人脸替换为用户图像。由于人脸融合模型是基于生成式对抗网络训练得到的,因此能够提取出图像的深层语义特征信息,并基于深层语义特征信息进行人脸融合,从而得到很好的人脸融合效果。
-
公开(公告)号:CN110503703B
公开(公告)日:2023-10-13
申请号:CN201910798510.0
申请日:2019-08-27
Applicant: 北京百度网讯科技有限公司
IPC: G06T11/60 , G06V40/16 , G06V10/82 , G06V10/75 , G06N3/0455
Abstract: 本公开的实施例公开了用于生成图像的方法和装置。该方法的一具体实施方式包括:获取底版图像和目标人脸图像,其中,该底版图像包括待替换人脸图像和背景;将该目标人脸图像输入至预先训练的图像生成模型,生成匹配人脸图像,其中,该图像生成模型包括编码网络、隐层网络和解码网络,该匹配人脸图像用于表征待替换人脸图像所显示的面部姿态与该目标人脸图像所显示的面部姿态一致;基于该匹配人脸图像对该待替换人脸图像的替换,生成准目标图像;基于对该准目标图像的融合处理,生成目标图像,其中,该目标图像包括与该匹配人脸图像相一致的人脸图像和与该底版图像相一致的背景。该实施方式实现了面部表情的精确传递,提升了人脸图像生成的自然度。
-
公开(公告)号:CN115272705B
公开(公告)日:2023-08-29
申请号:CN202210910399.1
申请日:2022-07-29
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/46 , G06V10/762 , G06V10/77 , G06V10/774 , G06N3/088
Abstract: 本公开提供了一种显著性物体检测模型的训练方法、装置以及设备,涉及人工智能技术领域,具体涉及图像处理、计算机视觉和深度学习等技术领域,尤其涉及智慧城市、智能交通等场景。该方法的一具体实施方式包括:获取样本图像集中的样本图像的至少两个层次的特征张量;基于样本图像的至少两个层次的特征张量,生成样本图像的视觉对比度信息和样本图像集的视觉对比度信息混杂集合;基于样本图像的视觉对比度信息和样本图像集的视觉对比度信息混杂集合,生成视觉对比度融合信息;基于视觉对比度融合信息和样本图像的视觉对比度信息进行训练,得到显著性物体检测模型。该实施方式能够解决显著性物体检测模型学习中的视觉对比度偏差问题。
-
公开(公告)号:CN111695517B
公开(公告)日:2023-08-18
申请号:CN202010538176.8
申请日:2020-06-12
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/412 , G06V30/14 , G06V30/18 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/045 , G06N3/0442 , G06N3/08
Abstract: 本申请实施例公开了一种图像的表格提取方法、装置、电子设备、存储介质及表格提取模型的训练方法,涉及人工智能和云计算技术领域,包括:获取待处理图像,根据表格提取模型,生成待处理图像的表格,其中,表格提取模型为根据样本图像的字段位置特征、图像特征及文本特征得到的,将待处理图像的文本信息填入至表格,一方面,通过字段位置特征,可以确定各字段在位置上的关联关系,可以适用于至少部分虚线框表格的图像,实现了提高表格识别的灵活性和广泛性的技术效果;另一方面,由于充分考虑了字段位置特征、图像特征及文本特征,即通过对待处理图像从多个维度进行分析,得到多个维度的特征,从而可以提高表格识别的准确性和可靠性的技术效果。
-
公开(公告)号:CN114612651B
公开(公告)日:2023-07-21
申请号:CN202210239359.9
申请日:2022-03-11
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/25 , G06V10/26 , G06V10/28 , G06V10/774 , G06V20/62 , G06V30/146 , G06V30/148 , G06V30/162 , G06V30/19
Abstract: 本公开提供了ROI检测模型训练方法、检测方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术。具体实现方案为:对样本图像进行特征提取,得到样本特征数据;对样本特征数据进行非线性映射,得到第一特征数据和第二特征数据;根据第一特征数据在标签ROI的关联区域中的第三特征数据和第二特征数据,确定区域间差异数据;根据区域间差异数据和标签ROI的关联区域,调整ROI检测模型的待训练参数。根据本公开的技术,提高了ROI检测模型的检测精度。
-
公开(公告)号:CN111523596B
公开(公告)日:2023-07-04
申请号:CN202010327799.0
申请日:2020-04-23
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/774 , G06V10/762 , G06V40/16 , G06N3/0464 , G06V10/82 , G06N3/08
Abstract: 本申请实施例公开了目标识别模型训练方法、装置、设备以及存储介质,涉及人工智能技术领域。该方法的一具体实施方式包括:获取训练样本集,其中,训练样本集中的训练样本是已标注目标样本图像;构建不同的第一深度卷积神经网络和第二深度卷积神经网络;利用第一深度卷积神经网络和第二深度卷积神经网络分别对训练样本集进行正负样本采样,得到正样本集和负样本集;基于正样本集和负样本集对第一深度卷积神经网络和第二深度卷积神经网络进行交叉训练,得到目标识别模型。该实施方式提供了一种基于正负学习的弱监督目标识别技术,能够充分利用错误标注样本进行弱监督学习,增加了模型的鲁棒性。
-
公开(公告)号:CN113313114B
公开(公告)日:2023-06-30
申请号:CN202110652178.4
申请日:2021-06-11
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/19 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本公开提供了证件信息获取方法、装置、设备以及存储介质,涉及人工智能技术领域,具体涉及计算机视觉和深度学习技术领域。具体实现方案为:获取目标证件图像;对目标证件图像进行文本识别,确定文本识别结果;响应于确定文本识别结果中包括字符,对文本识别结果中的字符进行再次识别,得到字符优化结果;根据字符优化结果,更新文本识别结果;输出更新后的文本识别结果。本实现方式能够对字符的识别结果进行优化,提高文本识别的准确度。
-
公开(公告)号:CN115565177B
公开(公告)日:2023-06-20
申请号:CN202210983230.9
申请日:2022-08-16
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/19 , G06V30/148 , G06V30/18 , G06V10/82 , G06N3/0455 , G06N3/084 , G06N3/088 , G06N3/0895 , G06N3/09
Abstract: 本公开提供了一种文字识别模型训练、文字识别方法、装置、设备及介质,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于文字检测识别技术等场景。具体实现方案为:将无标签的训练样本分割为至少两个子样本图像;将至少两个子样本图像划分至第一训练集合和第二训练集合;所述第一训练集合包括具有可见属性的第一子样本图像,所述第二训练集合包括具有不可见属性的第二子样本图像;以所述第二训练集合作为所述第一训练集合的标签,对待训练编码器执行自监督训练,得到目标编码器。
-
公开(公告)号:CN111914628B
公开(公告)日:2023-06-20
申请号:CN202010564107.4
申请日:2020-06-19
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/774 , G06V40/16
Abstract: 本申请公开了一种人脸识别模型的训练方法和装置,涉及人工智能、深度学习及计算机视觉技术领域,具体涉及人脸识别技术领域。具体实现方案为:获取第一训练图像,第一训练图像为未遮挡人脸图像,并获取多个遮挡物图像后,将多个遮挡物图像分别融合至未遮挡人脸图像,以生成多个第二训练图像,将第一训练图像和第二训练图像输入人脸识别模型,以对人脸识别模型进行训练。由此,采用未遮挡人脸图像和融合得到的多个第二训练图像对人脸识别模型进行训练,使得训练后的人脸识别模型能够同时准确识别出未遮挡人脸图像和遮挡人脸图像,解决了现有的人脸识别模型对存在遮挡物的人脸图像识别时精确率较低,甚至无法识别存在遮挡物的人脸图像的技术问题。
-
-
-
-
-
-
-
-
-