基于全卷积网络的多特征融合的目标检测方法

    公开(公告)号:CN107563381B

    公开(公告)日:2020-10-23

    申请号:CN201710816619.3

    申请日:2017-09-12

    Abstract: 本发明设计了一种基于全卷积网络的多特征融合的目标检测方法,其主要技术特点是:搭建具有六个卷积层组的全卷积神经网络;利用卷积神经网络的前五组卷积层提取图像特征,并将其输出进行融合,形成融合特征图;对融合后的特征图进行卷积处理,直接产生固定数目的不同大小的目标边框;计算卷积神经网络生成的目标边框与真实边框之间的分类误差与定位误差,利用随机梯度下降法降低训练误差,得到最终训练模型的参数,最后进行测试得到目标检测结果。本发明利用了深度卷积网络对目标的强大的表示能力,构建了用于目标检测的全卷积神经网络,提出了新的融合特征方法,提高了算法的检测速度和精度,获得了良好的目标检测结果。

    基于生成式对抗网络模型的数据增强行人再识别方法

    公开(公告)号:CN110188835A

    公开(公告)日:2019-08-30

    申请号:CN201910483958.3

    申请日:2019-06-05

    Abstract: 本发明涉及一种基于生成式对抗网络模型的数据增强行人再识别方法,包括使用Mask-RCNN图像分割算法分割出图像中行人的掩膜图像;结合掩膜图像和手工标注行人属性,训练一个端到端的改进星形生成式对抗网络,从一个摄像头下的真实行人图像生成任何数量摄像头下的假训练图像;使用训练好的改进星形生成式对抗网络生成所有真实图像对应的所有相机域的假训练图像;将真实图像和假训练图像一起送入行人再识别模型,计算行人图像间距离并完成行人再识别功能。本发明设计合理,利用生成式对抗网络生成更多的训练样本,同时生成的图像背景能够有效地表示相对应摄像头下的真实场景,有效提高行人再识别模型的鲁棒性和判决能力,有效提高了行人再识别的准确率。

    基于超特征融合与多尺度金字塔网络的目标检测方法

    公开(公告)号:CN109034210A

    公开(公告)日:2018-12-18

    申请号:CN201810721716.9

    申请日:2018-07-04

    Abstract: 本发明涉及一种基于超特征融合与多尺度金字塔网络的目标检测方法,包括利用深度卷积神经网络提取具有不同特征信息的分层多尺度特征图;进行超特征融合;构建新的多尺度金字塔网络;根据不同层分别构建不同大小和长宽比的目标候选框;构建一个新的用于多特征提取且能够防止梯度消失的卷积模块;利用多任务损失函数对多类别分类器和边界框回归器进行联合训练优化实现图像分类和目标定位功能。本发明利用深度卷积网络对目标的特征提取能力,考虑超特征融合方法改善特征表达能力,生成了一个新的模块防止梯度消失而且能更有效地帮助训练和提取特征,构建了用于目标检测的全卷积神经网络,提高了算法的检测精度,获得了良好的目标检测结果。

    基于全局特征损失函数的行人再识别方法

    公开(公告)号:CN108960142A

    公开(公告)日:2018-12-07

    申请号:CN201810721744.0

    申请日:2018-07-04

    CPC classification number: G06K9/00369 G06K9/00778 G06K9/66

    Abstract: 本发明涉及一种基于全局特征损失函数的行人再识别方法,将全部输入图像分成所有可能图像对,包括表示同一人的同类对和表示不同人的异类对;计算所有可能图像对之间的特征距离,从两类图像对之间的特征距离中分别统计形成全局的距离均值和方差;构建全局特征损失函数并使用该全局特征损失函数在学习过程中减小两个方差以及增大两个均值之间的差;将全局特征损失函数与分类损失函数和验证损失函数联合使用,共同增强特征的学习。本发明设计合理,充分利用了输入全体图像中相比于单张图像更为丰富的信息,使得特征的描述能力性能远远高于单纯的单张图片特征,使得系统整体匹配率大大提高。

    基于多路径密集特征融合全卷积网络的目标检测方法

    公开(公告)号:CN108846446A

    公开(公告)日:2018-11-20

    申请号:CN201810721733.2

    申请日:2018-07-04

    Abstract: 本发明涉及一种基于多路径密集特征融合全卷积网络的目标检测方法,利用深度卷积神经网络提取具有不同特征信息的分层多尺度特征图;利用自底向上的旁路连接进行自下而上的特征融合;利用自顶向下的密集旁路连接进行自上而下的密集特征融合;构建不同大小和长宽比的目标候选框;利用二分类器减少目标候选框中的简单背景样本,并利用多任务损失函数对二分类器、多类别分类器和边界框回归器进行联合优化。本发明基于深度卷积神经网络提取图像特征,利用多路径密集特征融合方法改善特征表达能力,构建了用于目标检测的全卷积网络,提出了减少冗余简单背景样本和多任务损失联合优化的策略,提高了算法的检测精度,获得了良好的目标检测结果。

    利用训练样本及折中度量的3D卷积神经网络构建方法

    公开(公告)号:CN107729993A

    公开(公告)日:2018-02-23

    申请号:CN201711033085.3

    申请日:2017-10-30

    CPC classification number: G06N3/0454

    Abstract: 本发明涉及一种利用训练样本及折中度量的3D卷积神经网络构建方法,其技术特点是:构造孪生结构的3D卷积神经网络;设置网络的损失函数,该损失函数由正样本损失、负样本损失及正则化损失构成,并在正则化损失中结合了马氏距离和欧氏距离;使用softmax损失函数,使用视频序列形式的数据集对网络进行预训练;构造正样本对和负样本对,对图像进行预处理和分割;有选择地利用训练样本对网络进行训练。本发明设计合理,其有选择地使用训练样本来提高训练效率并抑制过拟合,同时,在对特征进行度量时对欧氏距离和马氏距离进行权衡,从而构建3D卷积神经网络模型,试验表明本发明构建的模型及训练策略使得系统整体匹配率大大提升。

    基于帧间模式和运动修补的时域错误隐藏方法

    公开(公告)号:CN103313064B

    公开(公告)日:2016-04-13

    申请号:CN201310226333.1

    申请日:2013-06-07

    Abstract: 本发明涉及一种基于帧间模式和运动修补的时域错误隐藏方法,其主要技术特点是:包括以下步骤:根据与当前受损宏块上、下、左、右相邻的正确接收块的帧间模式信息进行错误隐藏方法分类,分别对受损块的运动矢量进行修复;使用运动补偿的方法,利用修复后得到的运动矢量在其参考帧中取得该受损块的重构值。本发明充分利用与受损宏块相邻正确接收块的帧间模式信息采用不同的错误隐藏方法对受损块的运动矢量进行修复,对复杂区域用基于子块的运动修补方法,对相对平坦区域用边界匹配法,对静止区域用零运动矢量法,能更精确地恢复出受损块的运动矢量,提高错误隐藏的效果,算法复杂度合适,能够保证在移动应用中的实时性。

    一种基于边信息精化的分布式视频编码及解码方法

    公开(公告)号:CN102256133B

    公开(公告)日:2013-11-06

    申请号:CN201110247616.5

    申请日:2011-08-26

    Abstract: 本发明公开了一种基于边信息精化的分布式视频编码及解码方法,编码方法包括小波变换、格雷码编码及LDPC编码步骤,其技术特点是:还包括在小波变换前对WZ帧进行分类编码步骤,解码方法包括LDPC解码、格雷码译码、小波反变换和重构步骤,其技术特点是:在重构后还包括边信息精化处理步骤,即采用运动补偿加权内插方法得到初始边信息,使用部分解码WZ帧的运动补偿精化更新边信息;将精化后的边信息送入解码器进行解码得到运补偿精化的重建帧。本发明设计合理,在编码端对WZ帧进行分类编码,在解码端采用运动补偿加权内插和部分解码的WZ帧来提高边信息的质量,进而提高重建帧的性能,在保持较低编码复杂度的情况下,提高了分布式视频编码的率失真性能。

    一种基于H.264分层B帧编码结构的码率控制方法

    公开(公告)号:CN101917614B

    公开(公告)日:2012-07-04

    申请号:CN201010190719.8

    申请日:2010-06-03

    Abstract: 本发明公开了一种基于H.264分层B帧编码结构的码率控制方法,用于依次对当前GOP中的每个编码帧进行码率控制,包括步骤:(1)根据信道带宽、帧率和之前一个GOP的目标比特数和实际编码比特数之差计算为每个GOP分配的比特数;(2)利用之前一个GOP的时域层编码信息计算为当前GOP中的时域层分配的比特数;(3)在对时域层完成编码之后根据其编码结果对剩余未编码时域层分配的比特数进行调整;(4)对每个编码帧分配编码比特数;(5)计算当前编码帧量化步长,在将该量化步长转换成QP之后,做进一步的调整得到码率控制模块的输出。本发明充分利用了分层B帧编码结构的特点,克服了JVT-G012码率控制算法及其改进算法在性能上的缺陷,实现对分层B帧编码结构更有效的码率控制。

Patent Agency Ranking