-
公开(公告)号:CN114333038B
公开(公告)日:2022-06-07
申请号:CN202210200453.3
申请日:2022-03-03
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V40/16 , G06V10/26 , G06V10/74 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本公开提供了一种对象识别模型的训练方法和对象识别方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及计算机视觉领域和深度学习领域,可应用于人脸识别和内容审核等场景下。对象识别模型的训练方法的具体实现方案为:检测包括完整结构的目标对象的第一样本图像,得到目标对象的关键点信息;根据关键点信息裁剪第一样本图像,得到针对目标对象的多个区域图像,每个区域图像包括目标对象的残缺结构;将多个区域图像分别与预定背景图像融合,得到多个第二样本图像;以及根据多个第二样本图像对目标检测模型进行训练。
-
公开(公告)号:CN115861684B
公开(公告)日:2024-04-09
申请号:CN202211448436.8
申请日:2022-11-18
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/045 , G06N3/08
Abstract: 本公开提供了图像分类模型的训练方法、图像分类方法及装置,涉及计算机技术领域,尤其涉及深度学习、计算机视觉等人工智能领域。方案为:获取互为镜像的第一图像和第二图像;分别对第一图像和第二图像进行特征提取,获取第一图像对应的第一特征图和第二图像对应的第二特征图;分别对第一特征图和第二特征图按通道维度进行池化操作,获取第一特征图对应的第一空间注意力权重图和第二特征图对应的第二空间注意力权重图;根据第一空间注意力权重图与第二空间注意力权重图,确定第一约束损失;根据第一约束损失对图像分类模型进行训练。该方法根据互为镜像的第一图像和第二图像的空间注意力权重图,进行注意力一致性约束,提高了模型的分类效果。
-
公开(公告)号:CN114926847B
公开(公告)日:2023-04-07
申请号:CN202111478344.X
申请日:2021-12-06
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V30/40 , G06F40/263 , G06V30/246 , G06V10/74 , G06V10/764
Abstract: 本公开提供了一种少数类语言的图像处理方法、装置、设备和存储介质,涉及人工智能技术领域,具体为自然语言处理、深度学习技术领域。具体实现方案为:获取少数类语言中的少数类字符元素;采用所述少数类字符元素构建少数类伪文本;将所述少数类伪文本转换为图像格式,并根据图像转换结果得到少数类语言图像。本公开实施例能够对少数类语言的处理效率。
-
公开(公告)号:CN115861684A
公开(公告)日:2023-03-28
申请号:CN202211448436.8
申请日:2022-11-18
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/045 , G06N3/08
Abstract: 本公开提供了图像分类模型的训练方法、图像分类方法及装置,涉及计算机技术领域,尤其涉及深度学习、计算机视觉等人工智能领域。方案为:获取互为镜像的第一图像和第二图像;分别对第一图像和第二图像进行特征提取,获取第一图像对应的第一特征图和第二图像对应的第二特征图;分别对第一特征图和第二特征图按通道维度进行池化操作,获取第一特征图对应的第一空间注意力权重图和第二特征图对应的第二空间注意力权重图;根据第一空间注意力权重图与第二空间注意力权重图,确定第一约束损失;根据第一约束损失对图像分类模型进行训练。该方法根据互为镜像的第一图像和第二图像的空间注意力权重图,进行注意力一致性约束,提高了模型的分类效果。
-
公开(公告)号:CN114926847A
公开(公告)日:2022-08-19
申请号:CN202111478344.X
申请日:2021-12-06
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V30/40 , G06F40/263 , G06K9/62 , G06V30/246 , G06V10/74 , G06V10/764
Abstract: 本公开提供了一种少数类语言的图像处理方法、装置、设备和存储介质,涉及人工智能技术领域,具体为自然语言处理、深度学习技术领域。具体实现方案为:获取少数类语言中的少数类字符元素;采用所述少数类字符元素构建少数类伪文本;将所述少数类伪文本转换为图像格式,并根据图像转换结果得到少数类语言图像。本公开实施例能够对少数类语言的处理效率。
-
公开(公告)号:CN114333038A
公开(公告)日:2022-04-12
申请号:CN202210200453.3
申请日:2022-03-03
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V40/16 , G06V10/26 , G06V10/74 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本公开提供了一种对象识别模型的训练方法和对象识别方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及计算机视觉领域和深度学习领域,可应用于人脸识别和内容审核等场景下。对象识别模型的训练方法的具体实现方案为:检测包括完整结构的目标对象的第一样本图像,得到目标对象的关键点信息;根据关键点信息裁剪第一样本图像,得到针对目标对象的多个区域图像,每个区域图像包括目标对象的残缺结构;将多个区域图像分别与预定背景图像融合,得到多个第二样本图像;以及根据多个第二样本图像对目标检测模型进行训练。
-
-
-
-
-