-
公开(公告)号:CN115641606A
公开(公告)日:2023-01-24
申请号:CN202211090641.1
申请日:2022-09-07
Applicant: 南京邮电大学
IPC: G06V40/10 , G06V10/80 , G06V10/52 , G06V10/764 , G06V10/766 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明计算机图像处理技术领域,具体地说,是一种基于TIPSSD的轻量级多尺度热红外行人检测方法,首先,利用轻量级骨干网络Resnext50替换掉原SSD网络中的vgg16;然后,在模型中引入特征金字塔实现多尺度语义信息融合,并和多尺度训练策略相结合;最后,在数据预处理部分引入图像原色填充策略,本发明利用轻量级骨干网络Resnext50替换掉原SSD网络中的vgg16,实现模型参数压缩的同时增加算法的非线性拟合能力,之后在模型中引入特征金字塔实现多尺度语义信息融合,从而提高对多尺度目标的检测效果,有利于模型在端侧设备上进行部署。
-
公开(公告)号:CN118379496A
公开(公告)日:2024-07-23
申请号:CN202410533364.X
申请日:2024-04-30
Applicant: 南京邮电大学
IPC: G06V10/26 , G06V40/18 , G06V10/80 , G06V10/774 , G06V10/82 , G06N3/0455
Abstract: 本发明属于计算机视觉技术领域,公开了一种融合swin‑transformer和通道注意力的视网膜血管分割方法,本发明在编码器部分将Swin‑transforme中的多头自注意力改为级联多头自注意力,减少计算冗余,在解码器中引入通道注意力模块,抑制无关特征,本发明增加特征融合模块,将深浅层特征进行融合,充分利用特征信息,增加分割精准。本发明可以提高血管分割精度,可以准确的分割出视网膜眼底图像的血管脉络,为医生进行疾病诊断提供重要辅助信息。
-