-
公开(公告)号:CN117058502A
公开(公告)日:2023-11-14
申请号:CN202310871137.3
申请日:2023-07-14
Applicant: 南京邮电大学
Abstract: 本发明属于行人重识别方法技术领域,公开了一种基于CLIP深度度量学习的文本到图像的跨模态行人重识别方法,首先构建文本图像数据库并进行预处理,对图片以及对应图片的文本描述两两配对,形成图片文本描述和对应行人图片的文本与图片模态的配对,然后对每一个文本描述和对应的行人图片使用对应的神经网络进行特征的学习,同时让两种模态的网络结构进行参数共享,将两种模态得到的特征投影到公共空间中,实现全局对齐视觉和文本嵌入,通过相似分布匹配,对图像‑文本相似分布和归一化标签匹配分布之间的模态差异最小化。本发明对模态内特征分布更为均匀,更有效的提取两种模态的特征,提高行人图片识别的精度,具有更好的跨模态分类性能。
-
公开(公告)号:CN116703779A
公开(公告)日:2023-09-05
申请号:CN202310799116.5
申请日:2023-07-03
Applicant: 南京邮电大学
IPC: G06T5/00 , G06V10/30 , G06V10/80 , G06V10/82 , G06N3/0464
Abstract: 本发明公开了一种基于AFF特征融合的图像去噪方法,属于多尺度图像去噪技术领域;该方法包括以下步骤:步骤S1:数据预处理;步骤S2:构建高斯合成去噪模型;在MRF‑Net骨干网络架构的基础上,构建新的高斯合成去噪模型DDMFFNet;步骤S3:对构建高斯合成去噪模型进行训练;步骤S4:测试数据集输入到训练好的高斯合成去噪模型DDMFFNett中,得到去噪后的图像。本发明通过对MRF‑Net模型的整体网络架构进行优化,利用改进的AFF特征融合模块,提取不同特征图像的信息,增强信息在不同层次的传输和表达能力,利用密集连接模块缓解梯度消失的问题,使特征的传输更加有效,增强网络的特征提取能力,增强特征重用能力,并且减少了冗余的参数,提升图像的去噪效果。
-
公开(公告)号:CN117152438A
公开(公告)日:2023-12-01
申请号:CN202311200605.0
申请日:2023-09-18
Applicant: 南京邮电大学
IPC: G06V10/26 , G06V10/82 , G06V10/44 , G06N3/0495 , G06N3/045 , G06N3/0464 , G06N3/096 , G06N3/084
Abstract: 本发明公开了一种基于改进DeepLabV3+网络的轻量级街景图像语义分割方法,属于计算机技术领域;包括以下步骤:对输入的图像进行预处理;将预处理的后图像输入到采用DY‑MobileNetV2网络作为骨干网络构建的分割模型,对输入的图像进行像素分类;分割模型包括用于特征提取的DY‑MobileNetV2网络、金字塔空洞卷积层DASPP、DeepLabV3+网络模型的编、解码架构、以及作为知识蒸馏教师网络的SAM模型;输出分类结果,将每个像素所属的语义类别标注在原始图像上,形成语义分割图像;采用平均交并比计算对分割后的图像进行验证。本发明通过采用DY‑MobileNetV2网络替换原本DeepLabV3+中的Xception,对金字塔空洞卷积层DASPP进行改进,增强网络的特征表达能力,降低资源消耗;提升参数运算速度,增加参数计算量,从而提升网络分割的精确度。
-
-