-
公开(公告)号:CN119295779B
公开(公告)日:2025-05-02
申请号:CN202411318602.1
申请日:2024-09-20
Applicant: 济南大学
IPC: G06V10/74 , G06V10/82 , G06V10/774 , G06V10/44 , G06V10/75 , G06V30/18 , G06N3/0499 , G06N3/0455 , G06N3/08 , G06V20/52
Abstract: 本发明提供了一种文本到图像跨模态行人重识别方法及系统,所述方案包括:获取待查询文本描述及其对应图像库;对于所述文本描述及图像库,分别利用预先训练的图像和文本特征编码器,获得文本特征和图像库中图像样本的图像特征;其中,所述图像和文本特征编码器的训练的损失函数包括整体匹配损失、局部匹配损失以及文本掩码预测损失;基于获得的文本特征和图像库中图像样本图像特征,通过相似度计算,确定与待查询文本描述相对应的图像,实现文本到图像跨模态行人重识别。
-
公开(公告)号:CN119295779A
公开(公告)日:2025-01-10
申请号:CN202411318602.1
申请日:2024-09-20
Applicant: 济南大学
IPC: G06V10/74 , G06V10/82 , G06V10/774 , G06V10/44 , G06V10/75 , G06V30/18 , G06N3/0499 , G06N3/0455 , G06N3/08 , G06V20/52
Abstract: 本发明提供了一种文本到图像跨模态行人重识别方法及系统,所述方案包括:获取待查询文本描述及其对应图像库;对于所述文本描述及图像库,分别利用预先训练的图像和文本特征编码器,获得文本特征和图像库中图像样本的图像特征;其中,所述图像和文本特征编码器的训练的损失函数包括整体匹配损失、局部匹配损失以及文本掩码预测损失;基于获得的文本特征和图像库中图像样本图像特征,通过相似度计算,确定与待查询文本描述相对应的图像,实现文本到图像跨模态行人重识别。
-