一种基于弱监督学习和视频时空特征的视频物体定位方法

    公开(公告)号:CN110765921B

    公开(公告)日:2022-04-19

    申请号:CN201910994258.0

    申请日:2019-10-18

    Abstract: 本发明提供了一种基于弱监督学习和视频时空特征的视频物体定位方法。该方法仅以视频段和视频段描述作为输入来定位描述中物体在视频中的位置,解决了现有方法需要大量边框标注的问题。同时本方法引入了候选框的时空关联并设计了一种多特征关系度量网络,解决了度量学习中多模态关系表达问题。该方法先对视频段分帧,用训练好的目标检测网络对每一帧提候选框,再对视频段描述进行实体解析,然后提取候选框和定位物体的特征,并用时空关联捕获模块得到候选框关联,最后将这些特征输入多特征关系度量网络得到候选框与物体的匹配度。该方法旨在减少人工标注成本,提高定位精度,并通过测试验证了方法的可行性,具有重要应用价值。

    一种基于余弦度量的深度哈希图像检索方法

    公开(公告)号:CN110309333A

    公开(公告)日:2019-10-08

    申请号:CN201910450067.8

    申请日:2019-05-28

    Abstract: 本发明提出了一种基于余弦度量的深度哈希图像检索方法。面对互联网上庞大的图片数据,为了满足用户的需求,找到一种快速且准确的图像检索方法成为了一个亟待解决的问题。基于余弦度量可以有效减少矢量长度的多样性进而提升检索性能,同时在损失函数中引入类别信息,它与余弦度量约束相结合,有助于共同学习同一网络中的相似性保持,也能充分利用分类信息。采用该方案可以有效的实现大规模图像检索,并且经过实验证明,本方案的性能优于目前现有的图像检索方法,具有很重要的应用价值。

    一种具有平衡相似性的余弦度量监督深度哈希算法

    公开(公告)号:CN112488231B

    公开(公告)日:2024-07-02

    申请号:CN202011443669.X

    申请日:2020-12-11

    Abstract: 一种具有平衡相似性的余弦度量监督深度哈希算法属于图像检索领域。深度监督哈希具有存储成本低、计算效率高等优势。然而,相似性保持、量化误差和不平衡数据仍然是深度监督哈希中的巨大挑战。本发明提出了一种成对相似性保持的深度哈希方案,解决上述问题。本方法使用深度网络作为基础模型来提取特征,并用哈希层替换最后的分类层使其输出哈希码。本方法设计了一种损失函数,能在训练过程中有效地保持语义相似性、处理类别不均衡和难易以及量化损失的问题。本发明方法获得的哈希码,用于图像检索时,对极度不均衡数据集能有效提高检索的准确率。

    一种基于余弦度量的深度哈希图像检索方法

    公开(公告)号:CN110309333B

    公开(公告)日:2021-09-17

    申请号:CN201910450067.8

    申请日:2019-05-28

    Abstract: 本发明提出了一种基于余弦度量的深度哈希图像检索方法。面对互联网上庞大的图片数据,为了满足用户的需求,找到一种快速且准确的图像检索方法成为了一个亟待解决的问题。基于余弦度量可以有效减少矢量长度的多样性进而提升检索性能,同时在损失函数中引入类别信息,它与余弦度量约束相结合,有助于共同学习同一网络中的相似性保持,也能充分利用分类信息。采用该方案可以有效的实现大规模图像检索,并且经过实验证明,本方案的性能优于目前现有的图像检索方法,具有很重要的应用价值。

    一种具有平衡相似性的余弦度量监督深度哈希算法

    公开(公告)号:CN112488231A

    公开(公告)日:2021-03-12

    申请号:CN202011443669.X

    申请日:2020-12-11

    Abstract: 一种具有平衡相似性的余弦度量监督深度哈希算法属于图像检索领域。深度监督哈希具有存储成本低、计算效率高等优势。然而,相似性保持、量化误差和不平衡数据仍然是深度监督哈希中的巨大挑战。本发明提出了一种成对相似性保持的深度哈希方案,解决上述问题。本方法使用深度网络作为基础模型来提取特征,并用哈希层替换最后的分类层使其输出哈希码。本方法设计了一种损失函数,能在训练过程中有效地保持语义相似性、处理类别不均衡和难易以及量化损失的问题。本发明方法获得的哈希码,用于图像检索时,对极度不均衡数据集能有效提高检索的准确率。

    一种基于弱监督学习和视频时空特征的视频物体定位方法

    公开(公告)号:CN110765921A

    公开(公告)日:2020-02-07

    申请号:CN201910994258.0

    申请日:2019-10-18

    Abstract: 本发明提供了一种基于弱监督学习和视频时空特征的视频物体定位方法。该方法仅以视频段和视频段描述作为输入来定位描述中物体在视频中的位置,解决了现有方法需要大量边框标注的问题。同时本方法引入了候选框的时空关联并设计了一种多特征关系度量网络,解决了度量学习中多模态关系表达问题。该方法先对视频段分帧,用训练好的目标检测网络对每一帧提候选框,再对视频段描述进行实体解析,然后提取候选框和定位物体的特征,并用时空关联捕获模块得到候选框关联,最后将这些特征输入多特征关系度量网络得到候选框与物体的匹配度。该方法旨在减少人工标注成本,提高定位精度,并通过测试验证了方法的可行性,具有重要应用价值。

Patent Agency Ranking