-
公开(公告)号:CN118570471A
公开(公告)日:2024-08-30
申请号:CN202410681152.6
申请日:2024-05-29
Applicant: 安徽工业大学
IPC: G06V10/26 , G06V10/30 , G06V10/774 , G06V10/82 , G06N3/0475 , G06N3/045
Abstract: 本发明公开了一种基于互竞双流网络的半监督医学图像分割方法,属于计算机视觉技术领域。本发明在互竞双流网络架构中,利用两个结构不同但性能相近的网络相互学习和竞争,以打破MT方法中由于模型单一不可变、以及教师‑学生模型之间过度耦合带来的限制;通过设计一种单图像对双向复制粘贴方法,利用两个混合图像来帮助模型双向对称地学习有标签数据和无标签数据之间的共同语义,从而缓解有标签数据与无标签数据间分布不对齐的问题;通过在输入的混合图像及其增强视图之间进行伪监督校正来有效降低伪监督阶段中潜在噪声对分割模型性能的影响。
-
公开(公告)号:CN118861340A
公开(公告)日:2024-10-29
申请号:CN202410885658.9
申请日:2024-07-03
IPC: G06F16/535 , G06F16/58 , G06V20/52 , G06V10/80 , G06V10/774 , G06V10/776
Abstract: 本发明公开了一种基于双向语义对齐的跨模态行人检索方法,属于计算机视觉技术领域。本发明通过深入分析文本和图像之间的中层语义,为缩小在全局匹配方法中所忽略的细粒度语义层面差距,提供更为丰富的语义理解;通过引入一种双向特征预测机制,即通过使用不完整的图像特征与完整的文本特征(或者完整的图像特征与不完整的文本特征)相结合,以预测并重构缺失的信息,实现更准确的文本‑图像跨模态对齐;在一个扩展的特征空间内,无缝集成来自文本和图像的多维语义和结构属性,以捕捉更细微的视觉细节和更深层的语义内容;提高了基于文本的图像检索任务的匹配精度和效率,使之能够在各种复杂的环境和条件下,有效识别和检索行人图像。
-
公开(公告)号:CN118552981A
公开(公告)日:2024-08-27
申请号:CN202410722819.2
申请日:2024-06-05
Applicant: 安徽工业大学
IPC: G06V40/10 , G06V40/70 , G06V10/762 , G06V10/774 , G06V10/82 , G06V10/20 , G06V10/32 , G06V10/40 , G06V10/74 , G06F16/583 , G06N3/088 , G06N3/084 , G06N5/04
Abstract: 本发明公开了一种基于双模态数据增强的无监督跨模态行人检索方法,属于计算机视觉技术领域。本发明通过同时对可见光和红外图像进行色彩增强,拉近不同模态在特征空间的距离,提高跨模态对齐的准确度;然后采用自适应反事实推理将图拓扑结构的学习约束在较小的范围内,使模型更易于学习到更优的拓扑结构;通过上述两种操作,最终提升无监督跨模态行人检索的性能。
-
公开(公告)号:CN117496210A
公开(公告)日:2024-02-02
申请号:CN202311478754.3
申请日:2023-11-06
Applicant: 安徽工业大学
IPC: G06V10/762 , G06V10/774 , G06V40/10 , G06V10/778
Abstract: 本发明公开了一种应用于无监督行人重识别的一致性距离度量方法,属于计算机视觉技术领域,包括以下步骤:S1:对于目标域无标签数据,利用样本在特征空间的原始距离进行聚类,得到初始的伪标签;S2:基于原始距离和初始伪标签,计算视角相关的全局相机修正项和局部相机修正项;S3:利用构造的修正项来重新计算修正后样本间相机无关的距离,并以此重新进行聚类,得到优化后的伪标签;S4:利用优化后的伪标签对模型进行微调。本发明可以确保行人图像在特征空间的距离度量不受视角差异的影响,进而得到更好的聚类结果和更可靠的伪标签。
-
-
-