-
公开(公告)号:CN114120074B
公开(公告)日:2023-12-12
申请号:CN202111306870.8
申请日:2021-11-05
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/80 , G06V10/764 , G06V10/82 , G06V10/74 , G06F40/30 , G06N3/0464 , G06N3/0442 , G06N3/0455 , G06N3/048 , G06N3/0895
Abstract: 根据本公开的实施例,提供了基于语义增强的图像识别模型的训练方法和装置、用于图像识别的方法和装置、电子设备以及计算机可读存储介质,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于图像处理、图像识别等场景。基于语义增强的图像识别模型的训练方法包括:从输入的未标注且无文字描述的第一图像中,提取第一图像的第一特征表示;基于第一特征表示,计算第一损失函数;从输入的未标注且具有原始文字描述的第二图像中,提取第二图像的第二特征表示;基于第二特征表示,计算第二损失函数;和基于第一损失函数和第二损失函数的融合,训练图像识别模型。以此方式,
-
公开(公告)号:CN113344055B
公开(公告)日:2023-08-22
申请号:CN202110596961.3
申请日:2021-05-28
Applicant: 北京百度网讯科技有限公司
Inventor: 安容巧
Abstract: 本公开披露了一种图像识别方法、装置、设备、介质和产品,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于图像识别场景下。图像识别方法包括:对待识别图像进行识别,得到目标对象在待识别图像中的位置信息和针对目标对象的第一标签;基于位置信息,将待识别图像中目标对象所在的区域图像和多个参考图像分别进行相似度比较得到比较结果,其中,每个参考图像包括参考对象和针对参考对象的第二标签;基于比较结果,从多个参考图像中确定目标图像;基于第一标签和目标图像的第二标签,确定针对目标对象的目标标签。
-
公开(公告)号:CN113327284B
公开(公告)日:2022-08-26
申请号:CN202110587847.4
申请日:2021-05-27
Applicant: 北京百度网讯科技有限公司
IPC: G06T7/70 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/04
Abstract: 本公开提供了一种图像识别方法,涉及人工智能领域,尤其涉及计算机视觉和深度学习领域。具体实现方案为:获取待识别图像;从待识别图像中的多个目标中识别未被遮挡的至少一个可见目标;确定每个可见目标的位置和类别;根据至少一个可见目标的位置和类别构建多个目标的空间关系矩阵;根据空间关系矩阵确定多个目标的数量。本公开还公开了一种图像识别装置、电子设备和存储介质。
-
公开(公告)号:CN111814628A
公开(公告)日:2020-10-23
申请号:CN202010608382.1
申请日:2020-06-29
Applicant: 北京百度网讯科技有限公司
Inventor: 安容巧
Abstract: 本申请公开一种陈列立柜识别方法、装置、设备以及存储介质,涉及图像处理、深度学习技术领域,尤其涉及人工智能和计算机视觉等技术领域。具体实现方案为:根据陈列立柜的初始识别结果,从陈列立柜图像中裁切位于顶层分隔板上的第一图像区域,以及位于次顶层分隔板与所述顶层分隔板之间的第二图像区域;基于颜色信息,对所述第一图像区域中的像素点和所述第二图像区域中的像素点进行聚类;根据聚类结果,对所述初始识别结果中的顶层分隔板进行校正,得到所述陈列立柜的最终识别结果。根据本申请的技术提高了陈列立柜层数的识别准确率。
-
公开(公告)号:CN115482533B
公开(公告)日:2023-06-16
申请号:CN202211140643.7
申请日:2022-09-19
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种陈列柜的拆分方法、装置、电子设备及存储介质,涉及计算机技术领域,尤其涉及计算机视觉、深度学习等人工智能技术领域。包括:获取待处理图像,待处理图像中包含陈列柜;对待处理图像进行语义分割及角点回归检测,以获取陈列柜对应的第一分隔板图像及第一角点检测结果;对待处理图像进行分隔板间隙检测,以获取陈列柜对应的第一间隙检测结果;根据第一角点检测结果或第一间隙检测结果,对第一分隔板图像中包含的第一分隔板进行拆分处理,以确定陈列柜中包含的各子陈列柜。由此,可以从第一角点检测结果及第一间隙检测结果中选择较优的检测结果,准确地将陈列柜拆分成多个子陈列柜,为确定商品在陈列柜中的具体位置提供了条件。
-
公开(公告)号:CN115984838A
公开(公告)日:2023-04-18
申请号:CN202211216873.7
申请日:2022-09-30
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种POI名称的生成方法、装置、电子设备和存储介质,该方法包括:获取待处理图像;将所述待处理图像输入至预设POI生成模型,以输出N维度的POI关联信息;其中,N≥2且取整数;基于N维度的所述POI关联信息,生成所述待处理图像中的POI名称。本公开中预设文字方向检测、识别内容、语义分类在同一个模型中端到端训练,减少中间步骤带来的累积误差,提升POI名称获取模型的精度,进一步提升检测、识别、分类的准确度;且该端到端的模型可以适配到预设文字方向检测、预设文字方向识别、文本语义分类多个任务上,无需引入多个模型,有效简化了从图像中提取POI名称的处理流程,提高整体的处理效率。
-
公开(公告)号:CN115512365A
公开(公告)日:2022-12-23
申请号:CN202211222031.2
申请日:2022-10-08
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/19 , G06V10/764 , G06N7/00
Abstract: 本公开提供了目标检测模型的训练、目标检测方法、装置及电子设备,涉及人工智能技术领域,具体涉及深度学习、图像处理、计算机视觉技术领域,可应用于OCR等场景。具体方案为:获取目标检测模型以及训练样本集,训练样本集包括第一样本图像以及第二样本图像;第一样本被标注有第一目标框以及第一目标类别,第二样本被标注有第二目标框以及第二目标类别,第一目标类别不同于第二目标类别,目标检测模型包括第一检测头网络以及第二检测头网络,第一检测头网络基于第一样本图像集预训练;对第二检测头网络进行模型训练,以更新第二检测头的模型参数,模型训练包括基于第二样本图像进行的第一子模型训练。本方案能使模型快速具备对新类别的识别能力。
-
公开(公告)号:CN113902905A
公开(公告)日:2022-01-07
申请号:CN202111183783.8
申请日:2021-10-11
Applicant: 北京百度网讯科技有限公司
Inventor: 安容巧
Abstract: 本公开提供了一种图像处理方法、装置和电子设备,涉及计算机视觉、深度学习等人工智能技术领域。具体实现方案为:在前端引导用户拍摄图像时,可以先获取捕获的第一图像对应的第一特征向量、以及在捕获第一图像之前拍摄的第二图像对应的第二特征向量,并将这两个特征向量进行匹配,得到第二图像相对于第一图像的投影矩阵,再在该投影矩阵上的基础上,结合第一图像和在第一图像之前捕获的第三图像,共同确定目标标记框,这样可以通过目标标记框准确地引导用户拍摄捕获到的图像,且在前端引导过程中,减少了标记框严重抖动的发生。
-
公开(公告)号:CN111310595B
公开(公告)日:2023-08-25
申请号:CN202010065727.3
申请日:2020-01-20
Applicant: 北京百度网讯科技有限公司
Inventor: 安容巧
IPC: G06V20/40 , G06V40/10 , G06V10/75 , G06V10/774 , G06V10/82 , G06N3/0464
Abstract: 本公开的实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:获取目标视频帧序列对应的用户位置信息集合,其中,用户位置信息用于表征该目标视频帧序列中显示的用户的位置,用户位置信息包括人体位置信息和局部人体位置信息;根据人体位置信息和局部人体位置信息,分别确定该目标视频帧序列中显示的用户的人体之间的关联度和局部人体之间的关联度;根据所确定的关联度,确定该目标视频帧序列中显示的用户的人体之间的关联关系和局部人体之间的关联关系;响应于确定所确定的关联关系相匹配,生成该目标视频帧序列中显示的用户的轨迹信息。该实施方式降低了检测和跟踪模型的复杂度,节约了网络传输流量。
-
公开(公告)号:CN115205555B
公开(公告)日:2023-05-26
申请号:CN202210818051.X
申请日:2022-07-12
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/74 , G06V10/774 , G06V10/82 , G06N3/08 , G06N3/04
Abstract: 本公开提供了确定相似图像的方法、训练方法、信息确定方法及设备,涉及人工智能技术领域,尤其涉及大数据、深度学习技术领域。具体实现方案为:获取待比对图像,待比对图像包括:第一图像和第二图像;对待比对图像进行全局特征提取,得到待比对图像中目标区域对应的目标全局特征;以及根据第一图像中第一区域的第一全局特征和第二图像中第二区域的第二全局特征,确定第一图像和第二图像之间的相似性比较结果;其中,第一区域的类别与第二区域的类别相同,目标全局特征包括:第一全局特征和第二全局特征,目标区域包括:第一区域和第二区域。
-
-
-
-
-
-
-
-
-