一种基于多视角补标签的图片分类方法与系统

    公开(公告)号:CN117274726B

    公开(公告)日:2024-02-23

    申请号:CN202311570268.4

    申请日:2023-11-23

    Inventor: 汤龙 刘业磊

    Abstract: 本发明公开了一种基于多视角补标签的图片分类方法与系统。所述方法包括:提取训练图片的多视角视觉特征;将提取的特征送入多视角补标签学习模型中,利用交替方向乘子法求解每个视角所对应的转换矩阵;利用得到的转换矩阵对待识别的图像进行分类。本发明通过约束训练样本与补标签向量集相似度及其与非补标签向量集相似度的数量关系构建损失函数;利用不同视角视觉特征之间的信息共享实现它们的一致性和互补性;利用样本的非补标签集构建一种样(56)对比文件Haoran Jiang等.ComCo: Complementarysupervised contrastive learning forcomplementary label learning《.NeuralNetworks》.2023,第169卷第44-56页.

    一种基于凸优化理论的抗噪声零样本图像分类方法

    公开(公告)号:CN115147607A

    公开(公告)日:2022-10-04

    申请号:CN202211078136.5

    申请日:2022-09-05

    Inventor: 汤龙 赵攀 潘志庚

    Abstract: 本发明公开基于凸优化理论的抗噪声零样本图像分类方法,提取待分类图片的视觉特征,输入预先训练获得的视觉‑语义映射模型,预测输出待分类图片的类别语义属性;利用图模型降噪算法,将待分类图片的视觉特征空间和预测输出待分类图片的类别语义属性空间进行流形对齐,获得最终的待分类图片的类别语义属性。预先训练获得视觉‑语义映射模型:构建视觉‑语义映射模型表达式;利用类别语义属性空间相似度和噪声鲁棒损失函数,建立鲁棒优化问题;使用凸凹迭代方法将求解鲁棒优化问题转化为求解一系列子优化问题;使用交替方向乘子法对子优化问题变量进行更新迭代,确定视觉‑语义映射模型中的相关参量,从而获得最终的视觉‑语义映射模型。

    一种基于实例的多视角视觉融合转导式零样本分类方法

    公开(公告)号:CN117541882B

    公开(公告)日:2024-04-19

    申请号:CN202410017127.8

    申请日:2024-01-05

    Inventor: 汤龙 赵靖涛

    Abstract: 本发明公开了一种基于实例的多视角视觉融合转导式零样本分类方法包括:提取已见类图片的多视角视觉特征;将已见类图片的多视角视觉特征和语义属性送入多视角视觉‑语义映射模型,利用交替方向乘子法学习不同视角上的转换矩阵;利用学习到的转换矩阵预测未见类图片的语义投影;再从语义投影进一步提取未见类图片的最终语义表示并基于此实现对未见类图片的识别;本发明提出采用单一的线性约束实现不同视角上的视觉信息的交互共享,简化了传统多视角信息融合模型的复杂度;同时,为了进一步挖掘在未见类中隐藏的视觉‑语义关联,提出一种自监督学习策略并利用多视角之间的一致性实现对未见类图片的语义校准,可大幅提升零样本分类的性能。

    一种基于多视角补标签的图片分类方法与系统

    公开(公告)号:CN117274726A

    公开(公告)日:2023-12-22

    申请号:CN202311570268.4

    申请日:2023-11-23

    Inventor: 汤龙 刘业磊

    Abstract: 本发明公开了一种基于多视角补标签的图片分类方法与系统。所述方法包括:提取训练图片的多视角视觉特征;将提取的特征送入多视角补标签学习模型中,利用交替方向乘子法求解每个视角所对应的转换矩阵;利用得到的转换矩阵对待识别的图像进行分类。本发明通过约束训练样本与补标签向量集相似度及其与非补标签向量集相似度的数量关系构建损失函数;利用不同视角视觉特征之间的信息共享实现它们的一致性和互补性;利用样本的非补标签集构建一种样本标签的半监督学习策略,实现对模型信息的充分挖掘,提高图像分类准确度。

    一种基于多视角对比置信度的图片识别方法及装置

    公开(公告)号:CN117237748A

    公开(公告)日:2023-12-15

    申请号:CN202311512633.6

    申请日:2023-11-14

    Inventor: 汤龙 周子昀

    Abstract: 本发明公开了一种基于多视角对比置信度的图片识别方法及装置。所述方法包括:提取训练图片的特征;将提取的特征送入由多视角对比置信度分类模型转换而来的对偶模型中,利用交替方向乘子法学习不同视角上的转换矩阵;利用学习到的转换矩阵对待识别的图像进行分类。本发明构建了适用于正类标记对比置信度下的分类混合铰链型损失函数;利用不同视角视觉特征之间的信息共享,将不同视角下的映射模型进行对齐,并建立它们在每个分铰链型损失函数上的嵌入约束,实现它们之间的一致性和互补性。本发明利用多视角视觉特征包含训练样本更丰富、更充分的信息,可有效提升对比置信度分类器的泛化性能,从而实现对图像的更精准的识别。

    一种基于多视角对比置信度的图片识别方法及装置

    公开(公告)号:CN117237748B

    公开(公告)日:2024-02-23

    申请号:CN202311512633.6

    申请日:2023-11-14

    Inventor: 汤龙 周子昀

    Abstract: 本发明公开了一种基于多视角对比置信度的图片识别方法及装置。所述方法包括:提取训练图片的特征;将提取的特征送入由多视角对比置信度分类模型转换而来的对偶模型中,利用交替方向乘子法学习不同视角上的转换矩阵;利用学习到的转换矩阵对待识别的图像进行分类。本发明构建了适用于正类标记对比置信度下的分类混合铰链型损失函数;利用不同视角视觉特征之间的信息共享,将不同视角下的映射模型进行对齐,并建立它们在每个分铰链型损失函数上的嵌入约束,实现它们之间的一致性和互补性。本发明利用多视角视觉特征包含训练样本更丰富、(56)对比文件Thanh-Binh Le等.On measuringconfidence levels using multiple views offeature set for useful unlabeled dataselection《.Neurocomputing》.2015,第173卷第1589-1601页.Jianlong Wu等.Essential TensorLearning for Multi-View SpectralClustering《.IEEE TRANSACTIONS ON IMAGEPROCESSING》.2019,第28卷(第12期),第5910-5922页.

    一种多视角零样本图像识别方法

    公开(公告)号:CN115424096B

    公开(公告)日:2023-01-31

    申请号:CN202211390481.2

    申请日:2022-11-08

    Abstract: 本发明公开了一种多视角零样本图像识别方法,包括:构建多视角视觉‑语义映射模型表达式;通过提取并融合已见类训练集中图片样本的多视角视觉特征,建立多视角视觉‑语义映射模型;提取待识别图片的多视角视觉特征;将待识别图片的多视角视觉特征输入训练获得的多视角视觉‑语义映射模型,输出待识别图片的预测类别语义属性,实现多视角零样本图像识别。本发明针对零样本识别中的多视角数据融合问题提出一种有效的解决途径,通过兼顾不同视角之间的一致性原则和互补性原则,并给出与之匹配的交替方向乘子法,有效提升零样本识别的精度。

    一种多视角零样本图像识别方法

    公开(公告)号:CN115424096A

    公开(公告)日:2022-12-02

    申请号:CN202211390481.2

    申请日:2022-11-08

    Abstract: 本发明公开了一种多视角零样本图像识别方法,包括:构建多视角视觉‑语义映射模型表达式;通过提取并融合已见类训练集中图片样本的多视角视觉特征,建立多视角视觉‑语义映射模型;提取待识别图片的多视角视觉特征;将待识别图片的多视角视觉特征输入训练获得的多视角视觉‑语义映射模型,输出待识别图片的预测类别语义属性,实现多视角零样本图像识别。本发明针对零样本识别中的多视角数据融合问题提出一种有效的解决途径,通过兼顾不同视角之间的一致性原则和互补性原则,并给出与之匹配的交替方向乘子法,有效提升零样本识别的精度。

    一种基于实例的多视角视觉融合转导式零样本分类方法

    公开(公告)号:CN117541882A

    公开(公告)日:2024-02-09

    申请号:CN202410017127.8

    申请日:2024-01-05

    Inventor: 汤龙 赵靖涛

    Abstract: 本发明公开了一种基于实例的多视角视觉融合转导式零样本分类方法包括:提取已见类图片的多视角视觉特征;将已见类图片的多视角视觉特征和语义属性送入多视角视觉‑语义映射模型,利用交替方向乘子法学习不同视角上的转换矩阵;利用学习到的转换矩阵预测未见类图片的语义投影;再从语义投影进一步提取未见类图片的最终语义表示并基于此实现对未见类图片的识别;本发明提出采用单一的线性约束实现不同视角上的视觉信息的交互共享,简化了传统多视角信息融合模型的复杂度;同时,为了进一步挖掘在未见类中隐藏的视觉‑语义关联,提出一种自监督学习策略并利用多视角之间的一致性实现对未见类图片的语义校准,可大幅提升零样本分类的性能。

Patent Agency Ranking