-
公开(公告)号:CN119832356A
公开(公告)日:2025-04-15
申请号:CN202411826002.6
申请日:2024-12-12
Applicant: 厦门大学
IPC: G06V10/774 , G06V10/771 , G06V10/74 , G06V10/82 , G06N3/0442 , G06N3/0455 , G06N3/084 , G06N3/0895
Abstract: 本发明公开一种可学习向量特征进行对比学习的单阶段弱监督目标定位方法、电子设备和存储介质,提升弱监督视觉定位任务的性能。方法包括:通过Transformer解码器得到可学习向量特征;选取#imgabs0#个具有最高置信度分数的可学习向量特征作为候选特征;将候选特征与文本特征映射到相同的语义空间;对可学习向量特征进行质量估计,得到负样本的质量分数;从每个图文对中选取#imgabs1#个可学习向量特征进行迭代可学习向量特征的选择;从匹配图文对中选取相似度分数最高的可学习向量特征作为正样本,从不匹配图文对中选取若干个可学习向量特征作为负样本,优化目标是最大化输入文本与正样本可学习向量特征的相似度、最小化输入文本与负样本可学习向量特征的相似度。