-
公开(公告)号:CN116778445A
公开(公告)日:2023-09-19
申请号:CN202310756970.3
申请日:2023-06-26
Applicant: 南京邮电大学
IPC: G06V20/56 , G06V10/46 , G06V20/64 , G06T7/50 , G06T7/62 , G06T7/80 , G06F17/16 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明属于计算机视觉图像处理领域,公开了一种基于关键点和物体高度投影的无锚框单目3D目标检测方法,包括:(1)准备数据集;(2)将训练集中的图片输入主干网络模块提取图像特征;(3)将主干网络提取的低层特征送入解码模块进行上采样;(4)将解码之后的特征送入检测头模块来检测相应的目标参数,计算每一个检测头的损失;(5)将检测头检测的目标信息输入位姿推理模块以推理目标的3D位姿,计算位姿的L2损失以及面积与距离指导损失;(6)使用验证集对模型进行验证,计算3D目标检测指标。本发明先基于关键点预测出粗略的3D检测框,然后利用物体高度投影来精确预估目标距离,提升了道路场景的3D目标检测精度。
-
公开(公告)号:CN113269038B
公开(公告)日:2022-07-15
申请号:CN202110419108.4
申请日:2021-04-19
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于多尺度的行人检测方法,第一步运用多尺度特征融合,来更多地学习不同尺度的特征,实现利用浅层的特征将简单的目标的区分开来,利用深层的特征将复杂的目标区分开来的目的;第二步,为了进一步提升网络对于多尺度,尤其是小目标的检测能力,用不同大小的滑窗,使得RPN输出经不同感受野滑窗生成的候选区域。本发明在行人检测方面具有一定的提升,而且比现有技术具有更好的鲁棒性,可以用于小目标行人的检测。
-
公开(公告)号:CN113205002A
公开(公告)日:2021-08-03
申请号:CN202110377777.X
申请日:2021-04-08
Applicant: 南京邮电大学
Abstract: 本发明公开了一种非受限视频监控的低清人脸识别方法,包含S1.准备训练集,S2.利用高清人脸图像数据对教师网络进行第一训练得到训练好的教师网络模型,第一训练包含利用第一特征提取网络提取高清人脸图像数据的第一特征;S3.将训练好的教师网络模型中的预权重赋予学生网络形成初始学生网络模型,将人工下采样低清人脸图像数据及真实场景下低清人脸图像数据联合输入到初始学生网络模型进行第二训练,得到训练好的低清人脸识别模型;S4.将测试集输入到训练好的低清人脸识别模型得到人脸验证和识别结果;在学生网络中引入了域鉴别器,学习具有域不变特性的特征表示,解决了现有模型对于非受限视频监控场景下低清人脸图片识别精度不高的问题。
-
公开(公告)号:CN112801899A
公开(公告)日:2021-05-14
申请号:CN202110073332.2
申请日:2021-01-20
Applicant: 南京邮电大学
IPC: G06T5/00
Abstract: 本发明公开了基于互补结构感知的内外循环驱动图像盲去模糊方法和装置,图像处理技术领域,方法包括:输入模糊图像并利用图像先验知识获得模糊图像的初始模糊核;基于L0+RDP正则化模型和初始化模糊核对模糊图像进行非盲去模糊的迭代处理;判断所述迭代处理是否达到预设最大迭代次数,若达到预设最大迭代次数时,停止迭代处理,获得最终的中间模糊核,利用最终的中间模糊核对输入的模糊图像进行非盲去模糊处理,获得去模糊的最终清晰图像。本发明的方法和装置在图像梯度L0稀疏先验的基础上引入了一个RDP函数作为正则项,能够在区分图像边缘陡度的情况下较好地保留图像边缘信息,提高去模糊结果的精度,进而能够更好地估计出模糊核和清晰图像。
-
公开(公告)号:CN111738919A
公开(公告)日:2020-10-02
申请号:CN202010446190.5
申请日:2020-05-22
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于线性多步残差稠密网的低清小脸真实感幻构方法,包括如下步骤:获取低分辨率人脸图像;将所述低分辨率人脸图像输入至最佳人脸幻构模型,得到高分辨率人脸图像。本发明通过在人脸幻构模型中引入线性多步机制使得深度网络具有更强的可解释性,并利用该机制指导构建更深层次的网络模型,另外使用残差稠密块加深网络用于提取高层特征,提升幻构人脸的质量。相较之前的若干代表方法,定量定性实验结果均表明本发明提出的方法幻构的人脸真实感更强。
-
公开(公告)号:CN110210354A
公开(公告)日:2019-09-06
申请号:CN201910433953.X
申请日:2019-05-23
Applicant: 南京邮电大学
Abstract: 本发明公开了一种雾霾天气交通标识检测与识别的方法,首先,对预先获取的雾霾天气交通场景图片依据卷积神经网络建立的图像去雾模型AOD_Net进行去雾操作;结合去雾处理后的图像,根据卷积神经网络提取图片的特征信息,通过三级级联卷积神经网络筛选候选区域,输出二分类结果与区域坐标;最后,将交通标识的区域输入到Densenet神经网络中,预测出具体的分类结果,从而在输出图片上,标记出检测识别的结果信息。使用该方法对拍摄到的雾霾图片进行处理,该方法的去雾检测识别的速率与精准率较高,基本能够满足目前交通系统辅助驾驶的需求。
-
公开(公告)号:CN107274383A
公开(公告)日:2017-10-20
申请号:CN201710346524.X
申请日:2017-05-17
Applicant: 南京邮电大学
CPC classification number: G06T7/0002 , G06K9/4604 , G06K9/4661 , G06K9/6256 , G06N3/0454 , G06T2207/30192
Abstract: 本发明公开了一种基于深度学习的雾霾能见度检测方法,首先创建包括训练样本集和交叉验证样本集的道路交通雾霾图像库;对交通雾霾图像库中所有的雾霾图像进行预处理;采用卷积神经网络提取训练样本集里预处理后的雾霾图像的最远能见度边缘特征,得到多个特征图;将特征图通过前向传播至配置好的卷积神经网络进行训练,并通过反向传播算法进行卷积神经网络中各层间权重的调整,反复迭代求取出用于雾霾图像分类的卷积神经网络模型,再通过预处理后的交叉验证样本集对卷积神经网络模型进行优化,最终得到一个用于对雾霾图像分类的能见度检测模型;利用上述得到的能见度检测模型对于路面摄像机拍摄的图片进行分类判断,从而实现对雾霾状况的实时检测。
-
公开(公告)号:CN104166962A
公开(公告)日:2014-11-26
申请号:CN201410365880.2
申请日:2014-07-29
Applicant: 南京邮电大学
Abstract: 本发明公开了一种使用散射核方法的锥束CT散射校正方法,其步骤为:步骤一:测量遮挡板下的散射信号;步骤二:自适应散射核参数的计算;步骤三:估计扩散函数的参数;步骤四:通过扩散函数对图像进行散射校正;步骤五:图像遮挡区域的修复;步骤六:锥束CT的重建。本发明不需要获取模型参数的先验数据,不增加图像获取及重建的复杂度,添加的设备复杂度不高,且不需要重复扫描被测物体,能高效的进行锥束CT散射校正。
-
公开(公告)号:CN104036473A
公开(公告)日:2014-09-10
申请号:CN201410239703.X
申请日:2014-05-30
Applicant: 南京邮电大学
Abstract: 本发明属于数字图像处理领域,提供了一种基于分裂Bregman迭代的快速鲁棒图像运动去模糊方法,通过直接利用图像梯度与运动模糊核的L0范数并结合其各自的L2范数,构建运动模糊核估计的非凸非光滑能量泛函;通过耦合算子分裂和增广拉格朗日方法,设计运动模糊核的分裂Bregman迭代求解格式;利用基于全变差先验的图像非盲去模糊方法,实现图像的快速去模糊。本发明通过引入支撑连续性先验,提高了运动模糊核的估计精度;设计了一种新的基于分裂Bregman迭代的快速解法,大幅提高了运动模糊核的估计效率。
-
公开(公告)号:CN114677576B
公开(公告)日:2024-10-29
申请号:CN202210253989.1
申请日:2022-03-15
Applicant: 南京邮电大学
IPC: G06V20/00 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种用于目标检测的自适应平衡训练损失的方法、装置及存储介质,方法包括:将训练样本输入检测模型,得到输出的用于计算损失的数据,包括预测框的位置、预测框的宽高以及预测框分类的得分;将损失平衡因子用于分类损失,对检测模型进行训练,优化计算得到分类损失平衡因子;将损失平衡因子用于边框回归损失,对检测模型进行训练,优化计算得到边框回归损失平衡因子;将所述分类损失平衡因子和边框回归损失平衡因子同时用于训练总损失,对检测模型进行训练,优化得到最优检测模型。实验结果证明,本发明设计出的损失平衡因子能有效平衡目标损失,提高检测器的平均精度,且数据集中的各个种类的检测精度都得到了不同程度的提升。
-
-
-
-
-
-
-
-
-