-
公开(公告)号:CN114119989B
公开(公告)日:2023-08-11
申请号:CN202111432043.3
申请日:2021-11-29
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/774 , G06V10/40 , G06V10/74 , G06V10/82 , G06N3/048 , G06N3/084 , G06F16/53 , G06F16/583
Abstract: 本公开提供了图像特征提取模型的训练方法、装置及电子设备,涉及人工智能技术领域,尤其涉及深度学习、计算机视觉技术领域。具体实现方案为:获取至少一目标样本图像;利用待训练的图像特征提取模型,提取至少一目标样本图像的第一图像特征,并利用指定网络模型,提取至少一目标样本图像的第二图像特征;基于第一图像特征、所提取的第二图像特征以及历史样本特征,计算图像特征提取模型的模型损失值;基于模型损失值,调整图像特征提取模型的模型参数。通过本方案,可以在保证图像特征提取模型的准确度的同时,降低了训练过程中GPU显存的占用。
-
公开(公告)号:CN113313113B
公开(公告)日:2022-09-23
申请号:CN202110651962.3
申请日:2021-06-11
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了证件信息获取方法、装置、设备以及存储介质,涉及人工智能技术领域,具体涉及计算机视觉和深度学习技术领域。具体实现方案为:获取目标证件图像;对目标证件图像进行文本识别,确定文本识别结果;根据文本识别结果,在目标证件图像中确定至少一个预设类型的字段所处的目标区域;对目标区域进行字符识别,确定字符识别结果;融合文本识别结果和字符识别结果,确定以及输出目标证件图像的文本信息。本实现方式能够分别识别文本和字符,提高文本识别的准确度。
-
公开(公告)号:CN114119989A
公开(公告)日:2022-03-01
申请号:CN202111432043.3
申请日:2021-11-29
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了图像特征提取模型的训练方法、装置及电子设备,涉及人工智能技术领域,尤其涉及深度学习、计算机视觉技术领域。具体实现方案为:获取至少一目标样本图像;利用待训练的图像特征提取模型,提取至少一目标样本图像的第一图像特征,并利用指定网络模型,提取至少一目标样本图像的第二图像特征;基于第一图像特征、所提取的第二图像特征以及历史样本特征,计算图像特征提取模型的模型损失值;基于模型损失值,调整图像特征提取模型的模型参数。通过本方案,可以在保证图像特征提取模型的准确度的同时,降低了训练过程中GPU显存的占用。
-
公开(公告)号:CN113657398A
公开(公告)日:2021-11-16
申请号:CN202110947890.7
申请日:2021-08-18
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了图像识别方法和装置,涉及人工智能技术领域,具体涉及计算机视觉和深度学习技术领域,具体可用于OCR光学字符识别等场景。具体实现方案为:获取待识别图像;将待识别图像输入预设的图像识别模型,得到与至少两个卡证图像中每一卡证图像对应的第一识别结果;根据第一识别结果所指示的类别,对与第一识别结果对应的卡证图像执行相应的识别操作,得到第二识别结果;汇总第二识别结果并输出。该方式有效提高了对多卡证图像进行识别的准确率和效率。
-
公开(公告)号:CN113656630A
公开(公告)日:2021-11-16
申请号:CN202110943222.7
申请日:2021-08-17
Applicant: 北京百度网讯科技有限公司
IPC: G06F16/583 , G06K9/62
Abstract: 本公开提供了检索图像的方法、装置和系统,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于图像处理和图像识别等场景下。具体实现方案为:响应于接收到包括目标图像的查询请求,从目标图像中检测目标主体;若检测到的目标主体的检测框的置信度大于第一阈值,则从目标主体中提取出主体特征,其中,主体特征包括相同特征、相似特征和类别;将目标图像的主体特征与数据库中预先存储的候选图像的主体特征进行匹配,得到候选图像的相似得分、相同得分;根据相似得分、相同得分选择预定数目个候选图像作为搜索结果输出。该实施方式实现了提高了检索的准确性。
-
公开(公告)号:CN114120074A
公开(公告)日:2022-03-01
申请号:CN202111306870.8
申请日:2021-11-05
Applicant: 北京百度网讯科技有限公司
Abstract: 根据本公开的实施例,提供了基于语义增强的图像识别模型的训练方法和装置、用于图像识别的方法和装置、电子设备以及计算机可读存储介质,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于图像处理、图像识别等场景。基于语义增强的图像识别模型的训练方法包括:从输入的未标注且无文字描述的第一图像中,提取第一图像的第一特征表示;基于第一特征表示,计算第一损失函数;从输入的未标注且具有原始文字描述的第二图像中,提取第二图像的第二特征表示;基于第二特征表示,计算第二损失函数;和基于第一损失函数和第二损失函数的融合,训练图像识别模型。以此方式,能够更有效且低成本地对图像识别模型进行训练。
-
公开(公告)号:CN113656668A
公开(公告)日:2021-11-16
申请号:CN202110955328.9
申请日:2021-08-19
Applicant: 北京百度网讯科技有限公司
IPC: G06F16/908
Abstract: 本公开提供了一种用于多模态信息库的检索方法、管理方法,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术领域,可应用于图像识别和图像搜索等场景下。实现方案为:响应于接收到包括第一模态信息的检索信息,使用第一多模态特征提取模块,从检索信息的第一模态信息中提取检索信息的第一模态特征;基于检索信息的第一模态特征与多条目标信息中的每条目标信息的第一模态特征和第二模态特征中的每一个的相似度,选择多条目标信息中的第一组目标信息;以及基于第一组目标信息,生成检索结果。
-
公开(公告)号:CN113313113A
公开(公告)日:2021-08-27
申请号:CN202110651962.3
申请日:2021-06-11
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了证件信息获取方法、装置、设备以及存储介质,涉及人工智能技术领域,具体涉及计算机视觉和深度学习技术领域。具体实现方案为:获取目标证件图像;对目标证件图像进行文本识别,确定文本识别结果;根据文本识别结果,在目标证件图像中确定至少一个预设类型的字段所处的目标区域;对目标区域进行字符识别,确定字符识别结果;融合文本识别结果和字符识别结果,确定以及输出目标证件图像的文本信息。本实现方式能够分别识别文本和字符,提高文本识别的准确度。
-
公开(公告)号:CN113255694B
公开(公告)日:2022-11-11
申请号:CN202110555863.5
申请日:2021-05-21
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了训练图像特征提取模型和提取图像特征的方法、装置,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于图像处理场景下。具体实现方案为:获取样本集和初始图像特征提取模型;从样本集中选取样本,执行如下训练步骤:将选取的样本的物品图像输入主干模型,得到图像特征向量;将图像特征向量分别与选取的样本的目标类别对应的预定数目的子中心向量计算相似度,并将相似度最大值作为目标类别的相似度;基于目标类别的相似度计算损失值;若损失值小于预定阈值,则确定出初始图像特征提取模型训练完成。通过该实施方式能够提高特征提取模型的训练速度和准确度,减少对精标数据的依赖。
-
公开(公告)号:CN114528424A
公开(公告)日:2022-05-24
申请号:CN202210039765.0
申请日:2022-01-12
Applicant: 北京百度网讯科技有限公司
IPC: G06F16/53 , G06F16/538 , G06F16/583 , G06V20/00 , G06V10/40 , G06V30/14 , G06V30/18 , G06V10/82 , G06N3/08
Abstract: 本公开提供了一种基于图像的信息搜索方法、装置、设备及其存储介质,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于图像处理等场景。具体实现方案为:首先,根据参考图像进行信息搜索,得到与参考图像匹配的一组图像及相应图像所对应的文本(例如,标题或概要信息等);之后,对参考图像和搜索结果中的每一图像所对应的文本进行图文相关度分析,得到每一图像的图文相关度得分;然后,将图文相关度得分低于阈值的图像从搜索结果中移除。如此,可大大减少搜索结果中,图像与参考图像相似,但图像关联的内容却与参考图像不相关的情况。
-
-
-
-
-
-
-
-
-