-
公开(公告)号:CN114647760B
公开(公告)日:2024-09-24
申请号:CN202210037094.4
申请日:2022-01-13
Applicant: 中国矿业大学
IPC: G06F16/783 , G06F16/75 , G06T5/90 , G06T5/40 , G06T7/11 , G06V10/26 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 一种基于神经网络自温故及知识传导机制的智能视频图像检索方法,在保证模型实时性的同时,提高小模型检索精度,在精度和效率之间尽可能达到平衡;设置伽马校正模块,通过对图像的局部调整,实现对光照不均匀鲁棒性,提高细节可辨度,避免高频噪声,普适性强;建立自温故机制,允许神经网络的局部自我监督,不断反思、调整学习参数,充分学习到图像深层语义信息,实现神经网络快速收敛,提高检索精度;采用知识传导机制,提升模型精度、降低模型时延,压缩网络参数,最终得到一个性能强和精度高的学生模型;通过传导机制将浅特征知识作为学习目标,采用VAE变分自编码模型重构深度特征,以此生成学习结果,将学习结果与目标进行度量,完成学习任务。
-
公开(公告)号:CN113610912B
公开(公告)日:2024-02-02
申请号:CN202110931555.8
申请日:2021-08-13
Applicant: 中国矿业大学 , 江苏华图矿业科技有限公司
IPC: G06T7/55 , G06T7/246 , G06T3/4053 , G06T3/4046 , G06N3/0464 , G06N3/088 , G06N3/0455 , G06V10/74
Abstract: 本发明是一种三维场景重建中低分辨率图像单目深度估计系统及方法,方法包括:步骤1、构建适合EDSR训练的数据库K‑DIV2K数据集;步骤2、采用数据集分别训练EDSR放大2倍、放大3倍和4倍模型,得到具有不同放大能力的超分辨率放大模块;步骤3、将得到的超分辨率放大模块进行多尺度深度预测,得到12个尺度的输入图片;步骤4、将步骤3中其中九个尺度的输入图片送到单目深度估计网络架构中,采用空洞卷积提取图像中的特征图,最终恢复出深度信息图。本发明提升了EDSR模型的泛化能力,使其能在KITTI数据集上得到较好的超分放大效果,提升了模型的在低分辨率输入图像下的特征提取能力和深度估计能力。
-
公开(公告)号:CN111768437B
公开(公告)日:2023-09-05
申请号:CN202010614124.4
申请日:2020-06-30
Applicant: 中国矿业大学
Abstract: 本发明涉及一种用于矿井巡检机器人的图像立体匹配方法及装置,属于立体匹配技术领域,解决了现有图像立体匹配方法对重复纹理区域与弱纹理区域的匹配精度较差的问题。获取物体的左视图和右视图分别作为参考图像和目标图像,对参考图像和目标图像分别进行逐像素邻域替换,得到参考图像和目标图像中每一像素点对应的灰度图;分别获取参考图像和目标图像灰度图对应的二进制码,并基于二进制码计算得到代价量;基于代价量对参考图像和目标图像分别进行匹配代价聚合,得到去除噪声的匹配代价;基于去除噪声的匹配代价,得到物体的视差图,提高了立体匹配的精度和质量。
-
公开(公告)号:CN111667509B
公开(公告)日:2023-05-26
申请号:CN202010531057.X
申请日:2020-06-11
Applicant: 中国矿业大学
Abstract: 本发明涉及目标跟踪技术领域,尤其涉及一种目标与背景颜色相似下的运动目标自动跟踪方法及系统,解决了直接采用CAMshift算法进行目标跟踪时的缺陷。方法包括:步骤S1:处理视频流,得到去噪后的序列帧图像;步骤S2:处理序列帧图像,得到第一帧图像中的前景目标;去除前景目标中的阴影,得到第一帧图像的运动目标区域;步骤S3:读取下一帧图像,将其作为当前帧图像,获取并处理当前帧图像、前一帧图像的运动目标区域的颜色‑曲率概率分布图,得到当前帧图像的候选区域;步骤S4:若当前帧图像的候选区域与前一帧图像的运动目标区域之间的巴氏距离大于距离阈值,将候选区域作为其运动目标区域;重复执行步骤S3与步骤S4,实现所述运动目标的跟踪。
-
公开(公告)号:CN114049251A
公开(公告)日:2022-02-15
申请号:CN202111022598.0
申请日:2021-09-01
Applicant: 中国矿业大学
Abstract: 一种用于AI视频分析的模糊图像超分辨率重建方法及装置,提出的多尺度特征提取及融合网络能够得到不同尺度下的浅层图像特征,增加图像特征的丰富度;采用多路径递归残差网络模型,可以很好地学习LR图像和HR图像之间的高频残差特征,首先,不同路径之间的信息可以相互共享,使得网络能够自适应地检测不同尺度的图像特征。其次,每一条路径可以从不同路径的梯度中受益,更加有助于图像特征信息的传播和梯度流动,以缓解训练过程中梯度的消失问题,提高训练效果和图像重建性能;采用的自门控Swish激活函数,有助于解决随着网络层数加深会出现过拟合问题,使得图像超分辨率重建有着较好的性能。
-
公开(公告)号:CN113627383A
公开(公告)日:2021-11-09
申请号:CN202110978611.3
申请日:2021-08-25
Applicant: 中国矿业大学
Abstract: 本发明提出了一种用于全景智能安防的行人徘徊重识别方法,该方法主要包括视频图片采集,图片质量评估,行人检测和重识别,徘徊判断几个部分:第一部分是图片采集部分,该部分是实现实时预览安防视频按秒截取图片并收集在存储器中;第二部分是图片质量评估,截取到的图片可能存在模糊,遮挡物过多等问题,将这样一些图片筛选掉;第三部分是行人检测和行人重识别,在这部分,我们联合检测和行人特征识别,将截取到的全景图片送入一个单一的神经网络中联合处理行人检测和重识别这两个任务;第四部分是行人徘徊判断,我们通过对相机id是否相同以及图片间隔时长判断行人是否徘徊。
-
公开(公告)号:CN113610912A
公开(公告)日:2021-11-05
申请号:CN202110931555.8
申请日:2021-08-13
Applicant: 中国矿业大学 , 江苏华图矿业科技有限公司
Abstract: 本发明是一种三维场景重建中低分辨率图像单目深度估计系统及方法,方法包括:步骤1、构建适合EDSR训练的数据库K‑DIV2K数据集;步骤2、采用数据集分别训练EDSR放大2倍、放大3倍和4倍模型,得到具有不同放大能力的超分辨率放大模块;步骤3、将得到的超分辨率放大模块进行多尺度深度预测,得到12个尺度的输入图片;步骤4、将步骤3中其中九个尺度的输入图片送到单目深度估计网络架构中,采用空洞卷积提取图像中的特征图,最终恢复出深度信息图。本发明提升了EDSR模型的泛化能力,使其能在KITTI数据集上得到较好的超分放大效果,提升了模型的在低分辨率输入图像下的特征提取能力和深度估计能力。
-
公开(公告)号:CN113592718A
公开(公告)日:2021-11-02
申请号:CN202110924404.X
申请日:2021-08-12
Applicant: 中国矿业大学
Abstract: 本发明是一种基于多尺度残差网络的矿井图像超分辨率重建方法及系统,该系统是通过图像超分辨率重建模型将低分辨率图像重建为高分辨率图像,图像超分辨率重建模型由浅层特征提取模块、深层特征提取模块和特征重建模块组成,深层特征提取模块由m个融合多尺度卷积、卷积注意力机制和残差连接的多尺度残差注意力组和一个特征融合层组成,整个特征提取模块采用简化后的密集网络将提取到的浅层特征和不同层次的深层特征传送到特征融合层进行特征融合。该矿井图像超分辨率重建方法包括如下步骤:提取图像浅层特征、深层特征,将提取到的浅层和深层特征进行融合,图像重建。本发明能够更有效的利用特征信息,可以有效防止图像特征信息丢失。
-
公开(公告)号:CN110312124A
公开(公告)日:2019-10-08
申请号:CN201910700754.0
申请日:2019-07-31
Applicant: 中国矿业大学
IPC: H04N17/00 , H04N19/86 , H04N19/176 , H04N19/137 , G06T7/13 , G06T7/246
Abstract: 本发明涉及一种基于显著性多特征融合的移动巡检视频质量修正方法,属于视频质量修正技术领域,解决了现有技术无法对移动巡检视频进行有效的质量评价并修正的问题。该方法包括如下步骤:对移动巡检视频中任一包括待检测物体的静止图像进行分块,确定包含待检测物体识别特征的所有宏块,以及各宏块的显著性因子;使用每个宏块分别遍历移动巡检视频中其他图像,获得各帧图像中与该宏块最相似的图像块,进而获得各宏块的运动矢量,以及每一帧图像的显著性矩阵;根据获得的显著性矩阵,确定移动巡检视频的块效应特征值、模糊效应特征值和信息熵特征值;建立视频质量评价模型,判断视频质量是否合格,如果不合格,修正摄像头参数,直到合格为止。
-
公开(公告)号:CN106851261A
公开(公告)日:2017-06-13
申请号:CN201710098920.5
申请日:2017-02-23
Applicant: 中国矿业大学
IPC: H04N17/00 , H04N19/177
CPC classification number: H04N17/00 , H04N19/177
Abstract: 本发明公开了一种基于GOP的视频质量评价方法,具体包含如下步骤:步骤1,获取视频序列中的GOP;步骤2,对步骤1获取的GOP中的I帧与P帧进行质量评价得到I帧与P帧的质量分数;步骤3,对I帧与P帧的质量分数分配权重加权得出单个GOP质量分数;步骤4,对所有的GOP的质量分数进行加权处理,得出视频序列的质量分数;因为在现有视频的MPEG编码后的GOP是由I、P、B三种不同帧类型组成的,在每个GOP中,基本为15∶2的格式,从每个GOP中选择出I与P帧,舍弃B帧,就会大大减少了需要评价的图像的数量;在视频序列中每一个GOP中I、P、B的重要性不同,可以根据I、P帧不同的重要性对I、P帧的质量分数分配不同权重,得到的视频质量评价结果更准确。
-
-
-
-
-
-
-
-
-