-
公开(公告)号:CN113902899A
公开(公告)日:2022-01-07
申请号:CN202111156486.4
申请日:2021-09-29
Applicant: 北京百度网讯科技有限公司
Inventor: 谌强
Abstract: 本公开提供了一种训练方法、目标检测方法、装置、电子设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术。具体实现方案为:将第一样本图像和第二样本图像输入第一预设模型,得到与第一样本图像对应的第一特征图和与第二样本图像对应的第二特征图;将第三样本图像和第四样本图像输入第二预设模型,得到与第三样本图像对应的第三特征图和与第四样本图像对应的第四特征图;基于第一对比损失函数,利用第一特征图、第二特征图、第三特征图和第四特征图,调整第一预设模型的模型参数,直至满足预设条件,其中,第二预设模型的模型参数的数值与第一预设模型的模型参数的数值相同;将在满足预设条件的情况下得到的第一预设模型确定为检测模型。
-
公开(公告)号:CN113902007A
公开(公告)日:2022-01-07
申请号:CN202111165084.0
申请日:2021-09-30
Applicant: 北京百度网讯科技有限公司
Inventor: 谌强
Abstract: 本公开提供了一种模型训练方法及装置、图像识别方法及装置、设备和介质,涉及人工智能领域,具体涉及计算机视觉和深度学习技术。方案为:采用识别模型中的编码器对样本图像进行编码,得到编码特征,并将编码特征输入识别模型中的多层映射网络,对多层映射网络中最后一层映射网络输出的映射特征进行对象预测,得到样本图像的预测标注信息,并根据预测标注信息和样本图像包括的实际标注信息之间的差异对识别模型进行训练,以使差异最小化。由此,相邻两层映射网络中的前一层映射网络的模型参数可以传递至后一层映射网络,由后一层映射网络根据前一层映射网络的模型参数进行模型参数更新,能够使得模型学习得到更好的特征表达,提升模型的预测效果。
-
公开(公告)号:CN114677565B
公开(公告)日:2023-05-05
申请号:CN202210371602.2
申请日:2022-04-08
Applicant: 北京百度网讯科技有限公司
Inventor: 谌强
IPC: G06V10/774 , G06V10/778 , G06V10/82 , G06V10/74 , G06N3/0464 , G06N3/048 , G06N3/096 , G06N3/091 , G06N3/09
Abstract: 本公开提供了一种特征提取网络的训练方法和图像处理方法、装置,涉及人工智能领域,具体涉及深度学习、计算机视觉和图像处理等技术领域。特征提取网络的训练方法的具体实现方案为:采用特征提取网络得到待处理图像的第一特征图;采用特征提取网络的教师模型得到待处理图像的第二特征图;针对第一特征图和第二特征图中的每个特征图,根据每个特征图中像素之间的关联关系,确定对应每个特征图的关联特征图;以及根据对应第一特征图的关联特征图和对应第二特征图的关联特征图,对特征提取网络进行训练。
-
公开(公告)号:CN113887631A
公开(公告)日:2022-01-04
申请号:CN202111168119.6
申请日:2021-09-30
Applicant: 北京百度网讯科技有限公司
Inventor: 谌强
Abstract: 本公开提供了一种图像数据处理方法、目标模型的训练方法、装置、设备、介质和产品,涉及人工智能技术领域,具体涉及计算机视觉和深度学习技术。图像数据处理方法包括:利用待评价图像数据更新目标模型的模型参数,得到更新后的目标模型;利用待验证图像数据验证更新后的目标模型的识别准确度;基于识别准确度,确定待评价图像数据的数据质量。
-
公开(公告)号:CN113887615A
公开(公告)日:2022-01-04
申请号:CN202111156550.9
申请日:2021-09-29
Applicant: 北京百度网讯科技有限公司
Inventor: 谌强
Abstract: 本公开提供了一种图像处理方法、装置、设备和介质,涉及人工智能领域,具体涉及计算机视觉和深度学习技术领域。图像处理方法的具体实现方案为:基于待检测图像,采用图像检测模型的自注意力网络获得第一图像特征;基于待检测图像,采用图像检测模型的卷积网络获得第二图像特征;以及基于第一图像特征与第二图像特征的融合特征,采用图像检测模型的预测网络获得检测结果。
-
公开(公告)号:CN115170815A
公开(公告)日:2022-10-11
申请号:CN202210700246.4
申请日:2022-06-20
Applicant: 北京百度网讯科技有限公司
Inventor: 谌强
IPC: G06V10/40 , G06V10/46 , G06V10/774
Abstract: 本公开提供了用于训练视觉处理模型的方法、处理视觉任务的方法、装置、设备、存储介质及计算机程序产品,涉及人工智能技术领域,尤其涉及深度学习、计算机视觉技术领域,可应用于图像处理、目标跟踪等场景。具体实现方案为:生成训练图像的多个层级特征图;针对所述多个层级特征图中的每一层级特征图,分别基于所述多个层级特征图进行特征融合;基于特征融合后的多个层级特征图,得到包括多个视觉处理子模型的视觉处理模型。通过本公开能够提高视觉任务处理性能。
-
公开(公告)号:CN115496916B
公开(公告)日:2023-08-22
申请号:CN202211231831.0
申请日:2022-09-30
Applicant: 北京百度网讯科技有限公司
Inventor: 谌强
IPC: G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本公开提供了一种图像识别模型的训练方法、图像识别方法以及相关装置,涉及人工智能技术领域,尤其涉及深度学习、图像处理、大模型、计算机视觉技术领域。具体实现方案为:获取初始模型的骨干网络包含的模型参数,对模型参数进行特征分解,得到模型参数的至少两个子参数,基于图像样本数据对初始模型进行迭代训练,以获得图像识别模型,在任一次迭代训练的过程中,基于本次迭代训练的输出结果和图像样本数据的样本标签,调整第一子参数,第二子参数保持不变。如此,达到了对骨干网络中少量参数进行微调的效果,能够在避免模型过拟合的情况下提升骨干网络的训练效果,能够训练得到能力更好的模型,从而提升了图像识别的准确性。
-
公开(公告)号:CN115170887A
公开(公告)日:2022-10-11
申请号:CN202210873466.7
申请日:2022-07-22
Applicant: 北京百度网讯科技有限公司
Inventor: 谌强
IPC: G06V10/764 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本公开涉及人工智能技术领域,尤其涉及图像处理、计算机视觉和深度学习等技术领域,可应用于智慧城市等场景。提供了一种目标检测模型训练方法和目标检测方法。该目标检测方法包括:将目标图像输入目标检测模型;获取所述目标图像的针对多个预设对象的预测结果,所述预测结果包括每一预设对象的域标签、类别及其类别置信度、以及预测边界框及其位置置信度,其中,所述目标检测模型采用本公开所描述的目标检测模型训练方法来训练得到。
-
公开(公告)号:CN118520135A
公开(公告)日:2024-08-20
申请号:CN202410796879.9
申请日:2024-06-19
Applicant: 北京百度网讯科技有限公司
IPC: G06F16/58 , G06F40/151 , G06V30/148 , G06F40/295
Abstract: 本公开提供了一种图像描述文本的生成方法,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型技术领域。具体实现方案为:将针对原始图像的视觉处理结果转换为视觉知识文本;根据原始图像以及视觉知识文本,生成原始图像的整图描述文本;根据原始图像的局部图像以及视觉知识文本,生成局部图像的局部描述文本;整合整图描述文本和局部描述文本,得到原始图像的整合描述文本。本公开还提供了一种图像描述文本的生成装置、电子设备和存储介质。
-
公开(公告)号:CN116611491A
公开(公告)日:2023-08-18
申请号:CN202310444257.5
申请日:2023-04-23
Applicant: 北京百度网讯科技有限公司
IPC: G06N3/08 , G06N3/0455 , G06N3/048 , G06N3/0499 , G06V10/82 , G06V10/40
Abstract: 本申请公开了目标检测模型的训练方法、装置、电子设备和存储介质,涉及人工智能技术领域,具体为计算机视觉、深度学习等技术领域,可应用于智慧城市等场景。方案为:对获取样本图像进行编码,获取样本图像对应的编码特征;对编码特征与M组查询特征中的每组查询特征进行解码,获取每组查询特征对应的一组预测结果,其中,M组查询特征是对目标检测模型的多个第一查询特征进行分组得到的;根据每组预测结果中各预测结果与样本图像对应的第一标注之间的匹配结果,对目标检测模型进行训练。由此,分组对预测结果与标注进行匹配,从整体上来讲,样本图像中每个目标可以匹配上多个正样本,使得每个样本图像的监督信号增强,加速了模型的收敛速度。
-
-
-
-
-
-
-
-
-