图像重建模型的迭代方法和图像重建方法

    公开(公告)号:CN116030156A

    公开(公告)日:2023-04-28

    申请号:CN202310161883.3

    申请日:2023-02-24

    Abstract: 本发明涉及图像处理技术领域,提供了一种图像重建模型的迭代方法和图像重建方法,其中图像重建模型的迭代方法包括:基于原始图像进行掩码,得到多个掩码图像;基于初始图像重建模型,对各个掩码图像中的掩码区域进行重建,得到所述各个掩码图像对应的重建图像;确定各个重建图像中两两重建图像之间的重叠区域,基于两两重建图像中重叠区域的区域特征之间的特征相似度,对所述初始图像重建模型进行参数迭代,得到图像重建模型,解决了传统方案中模型具有高度的不确定性和不一致性的问题,通过自洽机制可以使得不同重建图像之间的重叠区域保持一致,提升了模型的训练效率,同时优化了模型的预测准确率。

    基于一致性损失的细粒度图像模型训练及识别方法和装置

    公开(公告)号:CN114821203A

    公开(公告)日:2022-07-29

    申请号:CN202210745986.X

    申请日:2022-06-29

    Abstract: 本申请提供一种基于一致性损失的细粒度图像模型训练及识别方法和装置,涉及图像处理领域,该方法包括:获取样本图像对应的变换图像;将所述样本图像输入至图像识别模型,得到所述样本图像对应的第一行向量和第一列向量;将所述变换图像输入至所述图像识别模型,得到所述变换图像对应的第二行向量和第二列向量;根据所述第一行向量、所述第一列向量、所述第二行向量、所述第二列向量和所述样本图像的标注类别,对所述图像识别模型的参数进行调整。提高了图像识别模型的鲁棒性,以及图像识别模型对于图像的识别准确率。

    一种图像分类方法、装置、电子设备及存储介质

    公开(公告)号:CN112801238B

    公开(公告)日:2021-07-27

    申请号:CN202110403926.5

    申请日:2021-04-15

    Abstract: 本发明提供一种图像分类方法、装置、电子设备及存储介质,该方法包括:确定待分类图像中每一像素的特征表示;基于每一像素的特征表示,以及各个预设类别对应的全局特征表示,确定每一像素的特征增强表示;基于每一像素的特征表示和特征增强表示,确定所述待分类图像对应的预设类别;其中,所述全局特征表示是基于样本图像,以及样本图像中每一像素对应的预设类别确定的。本发明提供的方法、装置、电子设备及存储介质,采用像素级的特征增强方式提高了对图像中细节的表达能力,提高了图像的分类准确性。

    基于部位上下文的人体属性图像分类方法、系统和装置

    公开(公告)号:CN111783754B

    公开(公告)日:2020-12-08

    申请号:CN202010918876.X

    申请日:2020-09-04

    Abstract: 本发明属于计算机视觉领域,具体涉及了一种基于部位上下文的人体属性图像分类方法、系统和装置,旨在解决现有的人体分类方法忽略了人体属性之间的关系而未考虑人体内在层次结构信息导致分类精确度不足的问题。本发明包括:通过人体属性图像分类模型获取人体属性分类预测图;人体属性图像分类模型先通过特征提取网络提取待测试图像的原始特征图,再基于原始特征图通过属性分类解析网络获取高阶特征图,通过关系聚合网络和关系离散网络分别提取合适的上下文信息,将原始特征图和合适的上下文信息融合后生成人体属性分类预测图。本发明解决了如何从复杂北京中,对不同的属性产生合适的上下文特征的问题,提高了人体图像识别的精确度。

    基于部位上下文的人体属性图像分类方法、系统和装置

    公开(公告)号:CN111783754A

    公开(公告)日:2020-10-16

    申请号:CN202010918876.X

    申请日:2020-09-04

    Abstract: 本发明属于计算机视觉领域,具体涉及了一种基于部位上下文的人体属性图像分类方法、系统和装置,旨在解决现有的人体分类方法忽略了人体属性之间的关系而未考虑人体内在层次结构信息导致分类精确度不足的问题。本发明包括:通过人体属性图像分类模型获取人体属性分类预测图;人体属性图像分类模型先通过特征提取网络提取待测试图像的原始特征图,再基于原始特征图通过属性分类解析网络获取高阶特征图,通过关系聚合网络和关系离散网络分别提取合适的上下文信息,将原始特征图和合适的上下文信息融合后生成人体属性分类预测图。本发明解决了如何从复杂北京中,对不同的属性产生合适的上下文特征的问题,提高了人体图像识别的精确度。

    图文信息处理方法、装置、设备、存储介质及程序产品

    公开(公告)号:CN118820509B

    公开(公告)日:2025-02-11

    申请号:CN202411297843.2

    申请日:2024-09-18

    Abstract: 本发明提供一种图文信息处理方法、装置、设备、存储介质及程序产品,应用于计算机视觉技术领域。该方法包括:获取第一图文信息,所述第一图文信息包括第一文本和第一图像;为所述第一图像添加指示令牌,得到第二图文信息,所述指示令牌包括图像开始令牌和图像结束令牌,所述图像开始令牌位于所述第一图像之前,所述图像结束令牌位于所述第一图像之后;确定所述第一文本对应的文本特征,确定所述第一图像对应的图像特征,确定所述指示令牌对应的令牌特征,并根据所述文本特征、所述图像特征以及所述令牌特征确定输入序列;将所述输入序列输入大语言模型,得到对应的图文理解定位信息。

    基于多模态多形式统一的多轮图文理解与定位方法及装置

    公开(公告)号:CN118797562B

    公开(公告)日:2024-12-06

    申请号:CN202411282777.1

    申请日:2024-09-13

    Abstract: 本发明提供一种基于多模态多形式统一的多轮图文理解与定位方法及装置,涉及图像数据处理技术领域,方法包括:获取执行图文理解或定位任务的多模态数据,将多模态数据的待处理图像切分为多个图像块;确定多模态数据的待处理文本的文本特征以及图像块的图像序列特征;通过状态空间模型特征提取模块,对图像序列特征进行基于米字形结构方向的2D空间序列扫描,得到扫描序列特征;通过状态空间模型特征处理模块进行基于序列离散化的线性映射,得到离散序列特征后扫描合并,进而与文本特征融合得到多模态融合特征,用于执行图文理解或定位任务。通过本申请,解决神经网络模型在处理输入的长序列或高维度数据时,模型计算复杂度高的缺陷。

    目标检测方法、装置、电子设备以及存储介质

    公开(公告)号:CN116310520B

    公开(公告)日:2024-12-06

    申请号:CN202310153095.X

    申请日:2023-02-10

    Abstract: 本发明涉及图像处理技术领域,提供一种目标检测方法、装置、电子设备以及存储介质,其中方法包括:确定目标图像的多个图像块特征以及类别集合对应的类别特征集合;基于图像类别统一编码器,对图像块特征以及类别特征集合中的类别特征进行自注意力编码,基于得到的图像块编码特征与类别编码特征集合中各类别编码特征的相似度,确定目标类别编码特征用于目标检测,得到目标图像的目标检测结果。本发明提供的目标检测方法、装置、电子设备以及存储介质,通过图像类别统一编码器,以统一的方式为图像块和类别提取编码特征用于后续实现目标检测,从而实现了开放类别的目标检测,有效地在提升了目标检测模型在未见过类别上的泛化能力。

    图文信息处理方法、装置、设备、存储介质及程序产品

    公开(公告)号:CN118820509A

    公开(公告)日:2024-10-22

    申请号:CN202411297843.2

    申请日:2024-09-18

    Abstract: 本发明提供一种图文信息处理方法、装置、设备、存储介质及程序产品,应用于计算机视觉技术领域。该方法包括:获取第一图文信息,所述第一图文信息包括第一文本和第一图像;为所述第一图像添加指示令牌,得到第二图文信息,所述指示令牌包括图像开始令牌和图像结束令牌,所述图像开始令牌位于所述第一图像之前,所述图像结束令牌位于所述第一图像之后;确定所述第一文本对应的文本特征,确定所述第一图像对应的图像特征,确定所述指示令牌对应的令牌特征,并根据所述文本特征、所述图像特征以及所述令牌特征确定输入序列;将所述输入序列输入大语言模型,得到对应的图文理解定位信息。

    视觉检索模型的无监督训练方法、装置和电子设备

    公开(公告)号:CN116089652B

    公开(公告)日:2023-07-18

    申请号:CN202310364413.7

    申请日:2023-04-07

    Abstract: 本发明提供一种视觉检索模型的无监督训练方法、装置和电子设备,属于计算机视觉技术领域。该方法包括:将图像样本集输入视觉检索模型进行特征提取处理,获得目标特征信息;基于目标特征信息,为图像样本集中的各图像样本生成初始伪标签,并以各非离群图像样本为节点构建第一KNN图;以第一KNN图和目标特征信息为训练数据,以初始伪标签为监督数据对伪标签校正模型进行训练获得目标伪标签校正模型;基于目标特征信息,以图像样本集中的各图像样本为节点构建第二KNN图;将第二KNN图输入目标伪标签校正模型,获得校正伪标签;以图像样本集为训练数据,以校正伪标签为监督数据对视觉检索模型进行训练。该方法能提高视觉检索模型的性能。

Patent Agency Ranking