-
公开(公告)号:CN117423144A
公开(公告)日:2024-01-19
申请号:CN202311422976.3
申请日:2023-10-31
Applicant: 南京邮电大学
IPC: G06V40/16 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明属于计算机视觉技术领域,公开了一种针对小目标优化的自适应口罩佩戴检测方法,设计了自适应口罩检测网络(AMNet‑SO),在AMNet‑SO中融合卷积注意力模块,在颈部网络中设计了针对小目标检测的结构,使用动态区域感知卷积模块增强特征表达能力并利用跨阶段局部网络瓶颈进行多尺度特征融合,在头部网络中接收4个尺度的特征图进行检测,计算训练样本损失,并参与梯度反向传播过程,多轮迭代训练得到自适应口罩检测网络模型,对待测图片进行图片预处理,输入到检测模型中计算出检测框,将检测框利用加权框融合得到最后的检测框与得分,实现口罩佩戴检测。本发明使复杂场景下口罩佩戴检测的精度得到显著提高。
-
公开(公告)号:CN116958700A
公开(公告)日:2023-10-27
申请号:CN202310955757.5
申请日:2023-08-01
Applicant: 南京邮电大学
IPC: G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0895
Abstract: 一种基于提示工程和对比学习的图像分类方法,通过在视觉和文本两个模态使用Soft Prompt Tuning以实现对下游任务的适配,实现跨模态的双路多层感知机。本方法基于文本和图像特征,在11个公开数据集上可以实现较高的图像分类准确率,平均识别准确率在82.5%以上;本方法基于大规模预训练模型和提示微调的技术,在训练过程中只需要调整少量的模型参数,节省计算资源;本方法在多模态模型CLIP的训练过程中,将对比学习和少标签学习的损失结合起来,在先前技术的基础上,提升了模型收敛的速度。
-