一种基于无标签样本下文本融合的图像相似性检测方法

发明授权

CN114298159B 一种基于无标签样本下文本融合的图像相似性检测方法有权

请登陆查看更多内容

专利标题： 一种基于无标签样本下文本融合的图像相似性检测方法
申请号： CN202111482531.5

申请日： 2021-12-06
公开(公告)号： CN114298159B

公开(公告)日： 2024-04-09
发明人: 袁鑫攀 , 毛鑫鑫 , 谢少军 , 夏威 , 李长云
申请人： 湖南工业大学
申请人地址： 湖南省株洲市天元区泰山路88号
专利权人： 湖南工业大学
当前专利权人： 湖南工业大学
当前专利权人地址： 湖南省株洲市天元区泰山路88号
代理机构： 广州粤高专利商标代理有限公司
代理商 刘翔
主分类号： G06V10/74
IPC分类号： G06V10/74 ; G06V10/82 ; G06N3/0464 ; G06N3/0895 ; G06V10/80

摘要：

一种基于无标签样本下文本融合的图像相似性检测方法，属于图像相似性度量技术领域，包括以下步骤：S1：构建包含upper、middle、lower三个分支的TFCSiam模型；S2：对S1构建的模型进行训练；S3：利用S2训练好的模型进行图像间相似性度量。该方法通过引入无监督学习中的对比学习、文本融合结构只是将图像相关的文本信息作为图像特征的补充、通过图文跨模态模块将文本信息嵌入到一个图文语义共享的子空间，然后再将子空间的嵌入特征融合到图像当中等方法，实现了减小特征融合以及后续多模态投影的复杂度、提高模型预测精度、提高模型训练计算效率等效果。

公开/授权文献

CN114298159A 一种基于无标签样本下文本融合的图像相似性检测方法公开/授权日：2022-04-08

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06V	图像或视频识别或理解
G06V10/00	图像或视频识别或理解的安排（图像或视频中的字符识别 G06V30/10）
G06V10/70	.使用模式识别或机器学习（光学模式识别或电子计算 G06V10/88）
G06V10/74	..图像或视频模式匹配；特征空间中的邻近度量