-
公开(公告)号:CN119399505A
公开(公告)日:2025-02-07
申请号:CN202411529792.1
申请日:2024-10-30
Applicant: 安徽大学
IPC: G06V10/75 , G06V10/74 , G06V10/764 , G06V10/46 , G06V10/82 , G06N3/045 , G06N3/0895 , G06N3/096
Abstract: 本发明公开一种基于文本‑区域匹配的带有缺失标签场景下的多标签图像识别方法,使用预训练视觉‑语言模型作为特征提取器,对视觉特征和查询向量进行交叉注意力运算生成区域级显著性图;利用多层感知机生成查询级特征,通过区域级显著性图对视觉特征进行聚合运算生成区域级特征表示;然后进行知识蒸馏过程,将区域级特征表示的知识迁移到查询级特征表示上,还基于多模态对比学习方法,利用记忆块视觉原型和文本原型进行存储以及对比学习,使得相同特定类别特征彼此趋近,不同特定类别特征适当拉远,从而使原模型建立起更好的类内和类间关系,有效地提高了带有缺失标签场景下的多标签图像识别的准确性。
-
公开(公告)号:CN119228743A
公开(公告)日:2024-12-31
申请号:CN202411232082.2
申请日:2024-09-04
Applicant: 安徽大学
IPC: G06T7/00 , G06N3/0464 , G06V10/25 , G06N3/096 , G06N3/045 , G06V10/40 , G06V10/764 , G06N3/09 , G06N3/088 , G06N3/0475 , G06N3/094 , G06V10/74 , G06N3/048 , G06N3/084 , G06V10/774 , G06V10/766 , G06N20/00
Abstract: 本发明公开一种基于对比学习的X光图像域适应肺结节检测方法,使用源域图像训练模型,将模型复制得到教师模型和学生模型,然后源域图像经过强数据增强送入学生模型,目标域图像经过强数据增强和弱数据增强分别送入学生模型和教师模型。对于源域图像,通过标签计算监督损失,对于目标域图像,通过伪标签计算无监督损失。分层对比学习模块分别计算区域级和像素级对比损失,对抗学习模块通过来自于源域和目标域的区域级特征获得对抗性分类损失。最后合并损失函数进行模型优化,更新学生模型参数,通过指数滑动平均策略更新教师模型参数。本发明通过采用独特的分层对比学习策略,解决了低质量伪标签的问题,有效提高了X光图像域适应肺结节检测的精度。
-
公开(公告)号:CN120011593A
公开(公告)日:2025-05-16
申请号:CN202510072981.9
申请日:2025-01-17
Applicant: 安徽大学
IPC: G06F16/783 , G06N3/0455 , G06N3/0464 , G06N3/084 , G06N3/0895 , G06N3/09 , G06F16/78
Abstract: 本发明涉及计算机视觉技术领域,具体涉及基于双重语义对齐的视频时刻检索和高光检测方法,包括:利用视觉编码器和文本编码器分别提取视觉特征和文本特征;对视觉特征和文本特征进行交叉注意力运算得到联合特征;利用编码器和解码器对联合特征进行处理,编码器输出用于高光检测,解码器输出用于时刻检索;基于显著性对比学习实现片段级语义对齐;基于时刻中心距离实现时刻级语义对齐;采用匈牙利算法进行二分匹配,将预测时刻与真实时刻建立最优对应关系;联合优化高光检测损失和时刻检索损失更新编码器、解码器参数。本发明通过显著性对比学习方法和中心距离回归方法进行双重语义对齐,实现更准确地高光检测以及输出更准确的时刻检索。
-
-