-
公开(公告)号:CN115082430A
公开(公告)日:2022-09-20
申请号:CN202210851146.1
申请日:2022-07-20
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种图像分析方法、装置及电子设备,涉及计算机视觉技术领域,该图像分析方法包括:获取目标视觉任务的待分析图像;将待分析图像输入视觉分析模型,获得视觉分析模型输出的待分析图像中针对目标视觉任务的每一个目标物体特征的属性序列;该视觉分析模型用于基于目标视觉任务对待分析图像进行图像特征中目标物体特征的提取,并生成描述目标物体特征的属性序列;该视觉分析模型是基于目标视觉任务对应的样本图像和样本图像对应的标签数据训练得到的。本发明提供的技术方案能够将不同视觉任务统一成对待分析图像中物体的序列描述问题,视觉分析模型在多种视觉任务上具有通用性,提高了视觉任务处理的效率并降低了开发成本。
-
公开(公告)号:CN114419374A
公开(公告)日:2022-04-29
申请号:CN202210067225.3
申请日:2022-01-20
Applicant: 上海商汤智能科技有限公司 , 中国科学院自动化研究所
Abstract: 本申请实施例公开了一种模型训练及图像处理方法、装置、设备、存储介质及计算机程序产品,其中该方法包括:基于第一图像样本,确定第一场景图像和第二场景图像;第一场景图像与第二场景图像之间具有重叠区域;利用待训练的第一模型,对第一场景图像和第二场景图像分别进行特征提取,得到第一场景图像的第一场景特征和所述第二场景图像的第二场景特征,并利用第二模型,对第一场景图像和第二场景图像分别进行特征提取,得到第一场景图像的第三场景特征和第二场景图像的第四场景特征;基于第一场景特征和第二场景特征、第三场景特征和第四场景特征,确定目标损失值;基于目标损失值,对第一模型的模型参数进行至少一次更新,得到训练后的第一模型。
-
公开(公告)号:CN114255221A
公开(公告)日:2022-03-29
申请号:CN202111573623.4
申请日:2021-12-21
Applicant: 上海商汤智能科技有限公司 , 中国科学院自动化研究所
IPC: G06T7/00 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/04
Abstract: 本公开涉及一种图像处理、缺陷检测方法及装置、电子设备和存储介质,所述图像处理方法包括:对根据待处理图像得到的输入特征图在通道维度进行分组全连接处理,得到第一输出特征图;对所述输入特征图在空间维度进行局部特征聚合,得到聚合特征图;对所述聚合特征图在通道维度进行全连接处理,得到第二输出特征图;根据所述第一输出特征图和所述第二输出特征图,得到目标输出特征图,其中,所述目标输出特征图用于表征所述待处理图像中的目标对象。本公开实施例可以提高全连接处理的处理效率。
-
公开(公告)号:CN114419374B
公开(公告)日:2025-01-10
申请号:CN202210067225.3
申请日:2022-01-20
Applicant: 上海商汤智能科技有限公司 , 中国科学院自动化研究所
IPC: G06V10/82 , G06V10/40 , G06V10/44 , G06V10/26 , G06V10/25 , G06V10/764 , G06V20/70 , G06N3/0464 , G06N3/045 , G06N3/088 , G06N3/0895
Abstract: 本申请实施例公开了一种模型训练及图像处理方法、装置、设备、存储介质及计算机程序产品,其中该方法包括:基于第一图像样本,确定第一场景图像和第二场景图像;第一场景图像与第二场景图像之间具有重叠区域;利用待训练的第一模型,对第一场景图像和第二场景图像分别进行特征提取,得到第一场景图像的第一场景特征和所述第二场景图像的第二场景特征,并利用第二模型,对第一场景图像和第二场景图像分别进行特征提取,得到第一场景图像的第三场景特征和第二场景图像的第四场景特征;基于第一场景特征和第二场景特征、第三场景特征和第四场景特征,确定目标损失值;基于目标损失值,对第一模型的模型参数进行至少一次更新,得到训练后的第一模型。
-
公开(公告)号:CN114842307A
公开(公告)日:2022-08-02
申请号:CN202210776862.8
申请日:2022-07-04
Applicant: 中国科学院自动化研究所
IPC: G06V10/774 , G06V10/778
Abstract: 本发明提供一种掩码图像模型训练方法、掩码图像内容预测方法和设备,涉及图像处理技术领域,解决了预测的掩码图像内容准确度较低的问题。训练方法包括:将多个图像样本对应的可视化图像块输入至初始掩码图像模型中的非对称结构的初始编码模型中,得到各可视化图像块对应的编码特征对,并将各可视化图像块对应的编码特征对和第二数量个预设掩码补丁输入至初始掩码图像模型中的初始解码模型中,得到各掩码图像块对应的解码结果对;再根据多个图像样本各自对应的第二数量个掩码图像块和解码结果对,对初始编码模型和初始解码模型的模型参数进行更新,训练得到的掩码图像模型可以准确地预测掩码图像块的图像内容,提高了预测结果的准确度。
-
-
-
-