-
公开(公告)号:CN115082430B
公开(公告)日:2022-12-06
申请号:CN202210851146.1
申请日:2022-07-20
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种图像分析方法、装置及电子设备,涉及计算机视觉技术领域,该图像分析方法包括:获取目标视觉任务的待分析图像;将待分析图像输入视觉分析模型,获得视觉分析模型输出的待分析图像中针对目标视觉任务的每一个目标物体特征的属性序列;该视觉分析模型用于基于目标视觉任务对待分析图像进行图像特征中目标物体特征的提取,并生成描述目标物体特征的属性序列;该视觉分析模型是基于目标视觉任务对应的样本图像和样本图像对应的标签数据训练得到的。本发明提供的技术方案能够将不同视觉任务统一成对待分析图像中物体的序列描述问题,视觉分析模型在多种视觉任务上具有通用性,提高了视觉任务处理的效率并降低了开发成本。
-
公开(公告)号:CN114821203B
公开(公告)日:2022-09-27
申请号:CN202210745986.X
申请日:2022-06-29
Applicant: 中国科学院自动化研究所
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V10/26 , G06N3/04 , G06N3/08
Abstract: 本申请提供一种基于一致性损失的细粒度图像模型训练及识别方法和装置,涉及图像处理领域,该方法包括:获取样本图像对应的变换图像;将所述样本图像输入至图像识别模型,得到所述样本图像对应的第一行向量和第一列向量;将所述变换图像输入至所述图像识别模型,得到所述变换图像对应的第二行向量和第二列向量;根据所述第一行向量、所述第一列向量、所述第二行向量、所述第二列向量和所述样本图像的标注类别,对所述图像识别模型的参数进行调整。提高了图像识别模型的鲁棒性,以及图像识别模型对于图像的识别准确率。
-
公开(公告)号:CN115082430A
公开(公告)日:2022-09-20
申请号:CN202210851146.1
申请日:2022-07-20
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种图像分析方法、装置及电子设备,涉及计算机视觉技术领域,该图像分析方法包括:获取目标视觉任务的待分析图像;将待分析图像输入视觉分析模型,获得视觉分析模型输出的待分析图像中针对目标视觉任务的每一个目标物体特征的属性序列;该视觉分析模型用于基于目标视觉任务对待分析图像进行图像特征中目标物体特征的提取,并生成描述目标物体特征的属性序列;该视觉分析模型是基于目标视觉任务对应的样本图像和样本图像对应的标签数据训练得到的。本发明提供的技术方案能够将不同视觉任务统一成对待分析图像中物体的序列描述问题,视觉分析模型在多种视觉任务上具有通用性,提高了视觉任务处理的效率并降低了开发成本。
-
公开(公告)号:CN111738174B
公开(公告)日:2022-09-20
申请号:CN202010592997.X
申请日:2020-06-25
Applicant: 中国科学院自动化研究所 , 中国科学技术信息研究所
Abstract: 本发明属于计算机视觉领域,具体涉及一种基于深度解耦的人体实例解析方法、系统,旨在为了解决漏检和误检影响实例人体解析识别精度的问题,本发明方法包括:获取输入图像中候选区域的实例检测框和特征;所述候选区域为人体实例的候选区域;所述人体实例包括人体整体实例、人体部件实例;基于所述候选区域的特征,获取候选区域对应实例的实例掩模和实例特征;基于各候选区域对应的实例检测框、实例掩模、实例特征,通过层级式聚类算法进行人体整体‑人体部件关联聚类,获取人体实例解析结果。本发明可以提升实例人体解析的识别精度并减少人体实例的漏检和误检。
-
公开(公告)号:CN114419374A
公开(公告)日:2022-04-29
申请号:CN202210067225.3
申请日:2022-01-20
Applicant: 上海商汤智能科技有限公司 , 中国科学院自动化研究所
Abstract: 本申请实施例公开了一种模型训练及图像处理方法、装置、设备、存储介质及计算机程序产品,其中该方法包括:基于第一图像样本,确定第一场景图像和第二场景图像;第一场景图像与第二场景图像之间具有重叠区域;利用待训练的第一模型,对第一场景图像和第二场景图像分别进行特征提取,得到第一场景图像的第一场景特征和所述第二场景图像的第二场景特征,并利用第二模型,对第一场景图像和第二场景图像分别进行特征提取,得到第一场景图像的第三场景特征和第二场景图像的第四场景特征;基于第一场景特征和第二场景特征、第三场景特征和第四场景特征,确定目标损失值;基于目标损失值,对第一模型的模型参数进行至少一次更新,得到训练后的第一模型。
-
公开(公告)号:CN114255221A
公开(公告)日:2022-03-29
申请号:CN202111573623.4
申请日:2021-12-21
Applicant: 上海商汤智能科技有限公司 , 中国科学院自动化研究所
IPC: G06T7/00 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/04
Abstract: 本公开涉及一种图像处理、缺陷检测方法及装置、电子设备和存储介质,所述图像处理方法包括:对根据待处理图像得到的输入特征图在通道维度进行分组全连接处理,得到第一输出特征图;对所述输入特征图在空间维度进行局部特征聚合,得到聚合特征图;对所述聚合特征图在通道维度进行全连接处理,得到第二输出特征图;根据所述第一输出特征图和所述第二输出特征图,得到目标输出特征图,其中,所述目标输出特征图用于表征所述待处理图像中的目标对象。本公开实施例可以提高全连接处理的处理效率。
-
公开(公告)号:CN111738172B
公开(公告)日:2021-02-12
申请号:CN202010592282.4
申请日:2020-06-24
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于计算机视觉、模式识别领域,具体涉及一种基于特征对抗学习和自相似性聚类的跨域目标重识别方法、系统、装置,旨在解决现有的目标重识别方法由于聚类中心个数不固定,限制特征表达的判别力,导致识别结果鲁棒性较差的问题。本系统方法包括:获取待识别的图像,作为输入图像;对所述输入图像,通过预训练的特征提取网络提取其特征,作为第一特征;计算第一特征与图像库中各图像对应特征的欧式距离并进行排序,将排序结果进行输出。本发明提高了跨域目标重识别的鲁棒性。
-
公开(公告)号:CN111738172A
公开(公告)日:2020-10-02
申请号:CN202010592282.4
申请日:2020-06-24
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于计算机视觉、模式识别领域,具体涉及一种基于特征对抗学习和自相似性聚类的跨域目标重识别方法、系统、装置,旨在解决现有的目标重识别方法由于聚类中心个数不固定,限制特征表达的判别力,导致识别结果鲁棒性较差的问题。本系统方法包括:获取待识别的图像,作为输入图像;对所述输入图像,通过预训练的特征提取网络提取其特征,作为第一特征;计算第一特征与图像库中各图像对应特征的欧式距离并进行排序,将排序结果进行输出。本发明提高了跨域目标重识别的鲁棒性。
-
公开(公告)号:CN118887375B
公开(公告)日:2025-04-29
申请号:CN202411347904.1
申请日:2024-09-26
Applicant: 中国科学院自动化研究所
IPC: G06V10/22 , G06V10/26 , G06V10/764 , G06V10/82
Abstract: 本发明提供一种数据处理方法、装置、设备、存储介质及程序产品,应用于数据处理技术领域。该方法包括:获取待处理图像;将所述待处理图像输入单图文模型得到对应的文本描述信息,将所述待处理图像输入图像分割模型得到所述待处理图像中的对象类别信息;将所述文本描述信息和所述对象类别信息输入大语言模型,生成多对象关联问答信息,所述多对象关联问答信息包括图像理解信息和对象位置信息;对所述多对象关联问答信息中的对象进行图像回填,得到第一图文数据;将所述待处理图像和所述多对象关联问答信息输入奖励模型,得到检查项分数;根据所述检查项分数确定是否将所述第一图文数据确定为多模态训练数据。
-
公开(公告)号:CN116030156B
公开(公告)日:2023-07-18
申请号:CN202310161883.3
申请日:2023-02-24
Applicant: 中国科学院自动化研究所 , 武汉人工智能研究院
IPC: G06T11/00 , G06V10/74 , G06V10/774 , G06T5/50
Abstract: 本发明涉及图像处理技术领域,提供了一种图像重建模型的迭代方法和图像重建方法,其中图像重建模型的迭代方法包括:基于原始图像进行掩码,得到多个掩码图像;基于初始图像重建模型,对各个掩码图像中的掩码区域进行重建,得到所述各个掩码图像对应的重建图像;确定各个重建图像中两两重建图像之间的重叠区域,基于两两重建图像中重叠区域的区域特征之间的特征相似度,对所述初始图像重建模型进行参数迭代,得到图像重建模型,解决了传统方案中模型具有高度的不确定性和不一致性的问题,通过自洽机制可以使得不同重建图像之间的重叠区域保持一致,提升了模型的训练效率,同时优化了模型的预测准确率。
-
-
-
-
-
-
-
-
-