-
公开(公告)号:CN109190752A
公开(公告)日:2019-01-11
申请号:CN201810841610.2
申请日:2018-07-27
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
Abstract: 本发明涉及一种基于深度学习的全局特征和局部特征的图像语义分割方法,包括以下步骤:在编码端,使用基于深度学习卷积神经网络模型提取图像的基础深度特征,同时根据卷积层的深度将特征分为低层特征和高层特征;应用特征融合模块将低层特征和高层特征融合成增强型的深度特征;在获取深度特征后,将其输入到解码端;以交叉熵损失函数为目标训练网络,使用mIoU评价网络性能。本发明设计合理,其使用深度卷积神经网络模型提取图像的全局和局部特征,充分利用了全局特征和局部特征的互补性,并且利用了堆叠池化层进一步提高性能,有效地提高了图像语义分割地准确率。
-
公开(公告)号:CN107590489A
公开(公告)日:2018-01-16
申请号:CN201710899578.9
申请日:2017-09-28
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
Abstract: 本发明涉及一种基于级联卷积神经网络的目标检测方法,其主要技术特点是:利用卷积神经网络提取图像特征,并使用区域候选网络生成一定数量的目标候选框;使用优化网络对候选框进行优化;将优化后的目标候选框输入含多分类器的检测网络中,产生初步的检测结果;利用二值分类器对每一类目标进行再检测,排除错误目标得到最终精确的检测结果。本发明利用深度卷积网络对目标的强大的表示能力,构建了用于目标检测的级联卷积神经网络,提出了一种新的优化目标候选框的方法和排除错误检测样本的策略,提高了算法的检测精度,能够获得了良好的目标检测结果。
-
公开(公告)号:CN107563381A
公开(公告)日:2018-01-09
申请号:CN201710816619.3
申请日:2017-09-12
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
Abstract: 本发明设计了一种基于全卷积网络的多特征融合的目标检测方法,其主要技术特点是:搭建具有六个卷积层组的全卷积神经网络;利用卷积神经网络的前五组卷积层提取图像特征,并将其输出进行融合,形成融合特征图;对融合后的特征图进行卷积处理,直接产生固定数目的不同大小的目标边框;计算卷积神经网络生成的目标边框与真实边框之间的分类误差与定位误差,利用随机梯度下降法降低训练误差,得到最终训练模型的参数,最后进行测试得到目标检测结果。本发明利用了深度卷积网络对目标的强大的表示能力,构建了用于目标检测的全卷积神经网络,提出了新的融合特征方法,提高了算法的检测速度和精度,获得了良好的目标检测结果。
-
公开(公告)号:CN107240122A
公开(公告)日:2017-10-10
申请号:CN201710450319.8
申请日:2017-06-15
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
CPC classification number: G06T7/246 , G06T7/262 , G06T2207/10016 , G06T2207/20056 , G06T2207/20081
Abstract: 本发明涉及一种基于时空连续相关滤波的视频目标跟踪方法,其主要技术特点是:构造并计算损失函数;对输入帧进行深度卷积特征提取,利用深度卷积网络的第3~5层特征信息估计当前帧中目标的位置;根据每层估计的目标位置的准确度分配不同权重,将三层目标位置加权求和得到当前帧目标的最终位置;根据之前所有帧的估计结果更新模板。本发明结合了判别相关滤波器、深度学习技术,其利用多层特征进行目标位置估计,并根据之前所有帧的位置信息连续更新学习率,增加了整体算法的跟踪精度,提高了跟踪结果的稳定性,获得了很好的目标跟踪效果。
-
公开(公告)号:CN107679461A
公开(公告)日:2018-02-09
申请号:CN201710816499.7
申请日:2017-09-12
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
Abstract: 本发明设计了一种基于对偶综合-解析字典学习的行人再识别方法,其主要技术特点是:从行人再识别数据中提取行人图像特征;采用局部Fisher判决分析方法将不同摄像机视角下的行人图像特征投影到公共特征空间;运用对偶综合-解析字典学习算法,在公共特征空间中学习对偶综合字典和对偶解析字典;建立行人匹配模型,并利用改进余弦公式进行行人距离计算。本发明设计合理,其通过在原始对偶综合字典学习中引入对偶解析字典,解析字典拥有判决能力,提高了综合字典的数据表示能力,使得字典能够更有效的表示数据的本征结构,获得了有效的再识别性能。
-
公开(公告)号:CN107292914A
公开(公告)日:2017-10-24
申请号:CN201710450318.3
申请日:2017-06-15
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
Abstract: 本发明涉及一种基于小型单支卷积神经网络的视觉目标跟踪方法,其主要技术特点是:搭建小型单支卷积神经网络;设计损失函数用于卷积神经网络的训练;对测试序列进行目标跟踪,当新视频帧到来时,根据损失函数的结果判断网络参数的更新与否;将卷积神经网络的输出结果送给二元分类器,预测出目标位置。本发明利用了深度卷积网络对目标物体强大的表示能力,构建小型单支卷积神经网络,提出新的损失函数和更新策略,增加了整体算法的跟踪精度,提高了跟踪结果的稳定性以及跟踪速率,获得了很好的目标跟踪结果。
-
公开(公告)号:CN108960140B
公开(公告)日:2021-04-27
申请号:CN201810721690.8
申请日:2018-07-04
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
Abstract: 本发明涉及一种基于多区域特征提取和融合的行人再识别方法,利用残差网络提取全局特征,并在训练阶段增加一个用于全局特征提取和优化的行人身份分类模块;构造用于局部特征提取的多区域特征提取子网络,并将各局部特征进行加权融合;设置包括分类模块损失和特征融合模块损失的损失函数;对网络进行训练,得到模型提取查询集和测试集的特征向量;在度量阶段,利用交叉近邻方法对特征距离进行重新度量。本发明设计合理,有效结合了全局特征和局部特征,在距离度量方法上进行优化,获得了很好的行人再识别结果,使得系统整体匹配准确率大大提升。
-
公开(公告)号:CN107886116B
公开(公告)日:2021-03-26
申请号:CN201711033084.9
申请日:2017-10-30
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
Abstract: 本发明涉及一种针对视频数据行人再识别的LOMO3D特征提取方法,其技术特点是:将视频数据中的各帧分离出来,组织成图像序列的形式,并分割为一定长度的等长序列;将每个序列水平分割为若干扁平区域,并在这些区域中进一步划分子块,作为直方图统计的最小单位;对于每个子块,统计形成纹理直方图特征和HSV色域下的颜色直方图特征;将每个水平区域中的纹理和颜色直方图特征根据最大化原则进行整合并进行拼合,得到最终的LOMO3D特征描述子。本发明设计合理,充分利用了图像序列中的时空特征和时间信息,使得特征的描述能力性能远远高于单纯的空间域特征,试验表明本发明能够使得系统整体匹配率大大提升,优于目前其他的行人再识别算法。
-
公开(公告)号:CN109614853A
公开(公告)日:2019-04-12
申请号:CN201811273872.X
申请日:2018-10-30
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
Abstract: 本发明涉及一种基于身体结构划分的双线性行人再识别网络构建方法,包括以下步骤:对原始行人图像进行身体结构分块得到多个结构子框,将多个子框组合成新的行人图像,构造结构框预测子网络;设置加权的局部损失函数来训练该结构框预测子网络;构造两个子网络,分别以原始行人图像和重组后行人图像作为输入,对应地提取全局行人特征和局部行人特征;设置双线性融合层,并将其作为全局特征和局部特征的融合层,得到最终的行人特征表示;对整体网络进行训练,得到基于身体结构划分的双线性行人再识别模型。本发明结合整体特征和局部特征,充分利用了身体结构信息,通过双线性融合方法获得更具判别力的行人特征,使得系统整体匹配准确率大大提升。
-
公开(公告)号:CN107886116A
公开(公告)日:2018-04-06
申请号:CN201711033084.9
申请日:2017-10-30
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
CPC classification number: G06K9/629 , G06K9/00369 , G06K9/4647 , G06K9/4652
Abstract: 本发明涉及一种针对视频数据行人再识别的LOMO3D特征提取方法,其技术特点是:将视频数据中的各帧分离出来,组织成图像序列的形式,并分割为一定长度的等长序列;将每个序列水平分割为若干扁平区域,并在这些区域中进一步划分子块,作为直方图统计的最小单位;对于每个子块,统计形成纹理直方图特征和HSV色域下的颜色直方图特征;将每个水平区域中的纹理和颜色直方图特征根据最大化原则进行整合并进行拼合,得到最终的LOMO3D特征描述子。本发明设计合理,充分利用了图像序列中的时空特征和时间信息,使得特征的描述能力性能远远高于单纯的空间域特征,试验表明本发明能够使得系统整体匹配率大大提升,优于目前其他的行人再识别算法。
-
-
-
-
-
-
-
-
-