一种基于噪声可知的全网络监督目标检测方法

    公开(公告)号:CN111523586A

    公开(公告)日:2020-08-11

    申请号:CN202010300928.7

    申请日:2020-04-16

    Applicant: 厦门大学

    Inventor: 纪荣嵘 沈云航

    Abstract: 本发涉及一种基于噪声可知的全网络监督目标检测方法,其明通过构建包含主干卷积神经网络、候选区域池化层、弱监督检测头部网络和残差检测头部网络的网络模型,使其形成双分支网络结构;并且通过空间敏感熵标准来估算网络图片标签的置信度,然后根据估算的置信度来使用不同分支来训练模型,从而有效分解噪声,提高目标检测的准确率,而且对于包含错误前景标签的图片训练集,本发明的包混淆策略也能够减低出现前景噪声标签的概率,从而降低训练数据的标注成本,提高了数据的利用率。

    基于特定物体像素梯度图的弱监督目标检测方法

    公开(公告)号:CN109034258A

    公开(公告)日:2018-12-18

    申请号:CN201810877293.X

    申请日:2018-08-03

    Applicant: 厦门大学

    Inventor: 纪荣嵘 沈云航

    Abstract: 基于特定物体像素梯度图的弱监督目标检测方法,涉及计算机视觉技术。提出特定物体像素梯度图。在训练过程中,提取图像的特定物体像素梯度图。基于特定物体像素梯度图,模型可以粗略估算目标物体的形状和位置;利用累计的特定物体像素梯度图来掩盖对应的图像,然后用掩盖的数据集微调模型,目的是让模型可以找到更多物体的部件;提出一种平均‑最大值池化神经网络层,这种网络层可以很大程度帮助弱监督目标检测。算法没有提高网络模型的复杂度,也没有使用额外的监督信息。大量的实验结果表明,取得了优异的弱监督目标检测和定位性能。

    一种基于部件幂集和多尺度特征的行人重识别方法

    公开(公告)号:CN110633631B

    公开(公告)日:2022-02-18

    申请号:CN201910722268.9

    申请日:2019-08-06

    Applicant: 厦门大学

    Inventor: 纪荣嵘 沈云航

    Abstract: 一种基于部件幂集和多尺度特征的行人重识别方法,属于计算机视觉技术领域。包括以下步骤:1)初始化模型参数;2)输入训练图像到网络提取图像特征;3)计算训练图像的多尺度特征;4)枚举部件幂集并提取其特征;5)计算softmax交叉熵损失函数;6)计算triplet loss三元损失函数;7)计算组合排序模块的交叉熵损失函数;8)使用梯度下降算法更新模型参数;9)重复步骤2)~8)直到收敛;10)使用模型计算数据库里所有图像的特征向量;11)输入图像到模型中,获得目标的特征向量;12)计算目标和数据库图像的特征向量的欧氏距离;13)选择欧氏距离最近的数据库图像对应的行人身份作为最终检测结果。

    一种基于循环指导的弱监督联合目标检测和语义分割方法

    公开(公告)号:CN110633632A

    公开(公告)日:2019-12-31

    申请号:CN201910723018.7

    申请日:2019-08-06

    Applicant: 厦门大学

    Inventor: 纪荣嵘 沈云航

    Abstract: 一种基于循环指导的弱监督联合目标检测和语义分割方法,属于计算机视觉技术领域。初始化卷积神经网络;神经网络前向传播获得图像的特征图;目标检测分支前向传播获得目标定位图;语义分割分支前向传播获得分割掩膜;通过目标定位图得伪真实语义分割标注;通过分割掩码得图像候选区域权值;计算语义分割分支的损失;计算目标检测分支的损失;使用随机梯度下降算法更新参数;重复以上直到收敛;输入图像到神经网络中,得目标检测和语义分割结果;初始化卷积神经网络;神经网络前向传播得图像特征图;目标检测分支前向传播得目标检测结果;语义分割分支前向传播得语义分割掩膜;通过目标检测结果和语义分割掩膜得示例分割掩膜。

    一种基于卷积神经网络模型的暴恐视频检测方法

    公开(公告)号:CN106778590A

    公开(公告)日:2017-05-31

    申请号:CN201611128390.6

    申请日:2016-12-09

    Applicant: 厦门大学

    CPC classification number: G06K9/00718 G06K9/00744 G06K9/4671 G06N3/02

    Abstract: 一种基于卷积神经网络模型的暴恐视频检测方法,涉及计算机视觉和机器学习。包括以下步骤:1)深度神经网络模型的训练;2)在线暴恐视频检测。利用深度学习模型组合低层特征,形成更加抽象的高层表示属性或特征,以发现数据的分布式特征表示。通过该模型能够获取描述能力强的视频图像特征描述子。该特征描述子涵盖了视频图像从低到高各个层次的特征信息,从而大大提高了暴恐视频检测的准确率和召回率。通过少量样本来训练深度卷积网络来获得优秀的检测性能。对恐怖图片检测准确率达99%以上,召回率达98%以上。对于恐怖视频检测准确率达95%,召回率达99%。训练过程无需人工参与,自动根据少量样本生成海量数据。

    一种基于改进深度残差网络的弱监督目标检测方法

    公开(公告)号:CN111523585A

    公开(公告)日:2020-08-11

    申请号:CN202010300251.7

    申请日:2020-04-16

    Applicant: 厦门大学

    Inventor: 纪荣嵘 沈云航

    Abstract: 本发明涉及一种基于改进深度残差网络的弱监督目标检测方法,其在构建网络模型时,采用深度残差网络作为主干网络,并将候选区域池化层和冗余自适应脖子网络结合到主干网络和弱监督检测头部网络之间,有效弥补了已有的深度残差网络应用于弱监督目标检测时的缺点,大大提升了弱监督目标检测的性能。

    一种基于卷积神经网络模型的暴恐视频检测方法

    公开(公告)号:CN106778590B

    公开(公告)日:2020-07-17

    申请号:CN201611128390.6

    申请日:2016-12-09

    Applicant: 厦门大学

    Abstract: 一种基于卷积神经网络模型的暴恐视频检测方法,涉及计算机视觉和机器学习。包括以下步骤:1)深度神经网络模型的训练;2)在线暴恐视频检测。利用深度学习模型组合低层特征,形成更加抽象的高层表示属性或特征,以发现数据的分布式特征表示。通过该模型能够获取描述能力强的视频图像特征描述子。该特征描述子涵盖了视频图像从低到高各个层次的特征信息,从而大大提高了暴恐视频检测的准确率和召回率。通过少量样本来训练深度卷积网络来获得优秀的检测性能。对恐怖图片检测准确率达99%以上,召回率达98%以上。对于恐怖视频检测准确率达95%,召回率达99%。训练过程无需人工参与,自动根据少量样本生成海量数据。

    一种基于部件幂集和多尺度特征的行人重识别方法

    公开(公告)号:CN110633631A

    公开(公告)日:2019-12-31

    申请号:CN201910722268.9

    申请日:2019-08-06

    Applicant: 厦门大学

    Inventor: 纪荣嵘 沈云航

    Abstract: 一种基于部件幂集和多尺度特征的行人重识别方法,属于计算机视觉技术领域。包括以下步骤:1)初始化模型参数;2)输入训练图像到网络提取图像特征;3)计算训练图像的多尺度特征;4)枚举部件幂集并提取其特征;5)计算softmax交叉熵损失函数;6)计算triplet loss三元损失函数;7)计算组合排序模块的交叉熵损失函数;8)使用梯度下降算法更新模型参数;9)重复步骤2)~8)直到收敛;10)使用模型计算数据库里所有图像的特征向量;11)输入图像到模型中,获得目标的特征向量;12)计算目标和数据库图像的特征向量的欧氏距离;13)选择欧氏距离最近的数据库图像对应的行人身份作为最终检测结果。

    一种基于噪声可知的全网络监督目标检测方法

    公开(公告)号:CN111523586B

    公开(公告)日:2022-09-06

    申请号:CN202010300928.7

    申请日:2020-04-16

    Applicant: 厦门大学

    Inventor: 纪荣嵘 沈云航

    Abstract: 本发涉及一种基于噪声可知的全网络监督目标检测方法,其明通过构建包含主干卷积神经网络、候选区域池化层、弱监督检测头部网络和残差检测头部网络的网络模型,使其形成双分支网络结构;并且通过空间敏感熵标准来估算网络图片标签的置信度,然后根据估算的置信度来使用不同分支来训练模型,从而有效分解噪声,提高目标检测的准确率,而且对于包含错误前景标签的图片训练集,本发明的包混淆策略也能够减低出现前景噪声标签的概率,从而降低训练数据的标注成本,提高了数据的利用率。

Patent Agency Ranking