一种基于超像素的确定性模型拟合方法

    公开(公告)号:CN105913423A

    公开(公告)日:2016-08-31

    申请号:CN201610214978.7

    申请日:2016-04-08

    Applicant: 厦门大学

    Abstract: 一种基于超像素的确定性模型拟合方法,涉及计算机视觉技术。包括以下步骤:A.准备数据集;B.对图片进行超像素分割;C.通过分析超像素信息,对输入的数据进行预分组,以降低算法搜索时间复杂度;D.在数据集的分组信息基础上,提出一种确定性生成假设方法;E.提出一种模型选择方法,每次选取最佳模型假设,同时去除多余模型假设;F.根据选取的每个模型实例,区分内点与野点,完成模型拟合。能提取超像素分割的有效信息,以确定性地生成高质量的模型假设。有效避免当前模型选择方法对内点尺度的敏感性。能确定地处理多结构模型数据,而且不需大量的迭代优化,从而保证方法高效性。

    基于卷积神经网络的快速目标检测方法

    公开(公告)号:CN104573731A

    公开(公告)日:2015-04-29

    申请号:CN201510061852.6

    申请日:2015-02-06

    Applicant: 厦门大学

    Abstract: 基于卷积神经网络的快速目标检测方法,涉及计算机视觉技术。首先利用训练集训练出卷积神经网络参数,然后利用扩展图的方式解决最大池化丢失特征的问题并生成判别完备特征图;把卷积神经网络的全连接权重看成线性分类器,采用可能近似学习框架来估计线性分类器在判别完备特征上的泛华误差;根据泛华误差和所期望泛化误差阈值来估算所需线性分类器个数,最后在判别完备特征图上用线性分类器基于平滑窗的方式完成目标检测。显著提高检测效率和目标检测精度。

    一种在动态场景下以深度为主导线索的多目标跟踪方法

    公开(公告)号:CN102622769B

    公开(公告)日:2015-03-04

    申请号:CN201210073384.0

    申请日:2012-03-19

    Applicant: 厦门大学

    Abstract: 一种在动态场景下以深度为主导线索的多目标跟踪方法,涉及一种多目标跟踪方法。A从双目摄像机中获取当前帧,对双目图像校正;B.对图像进行颜色分割得颜色块;C对场景进行三维重构,得稠密深度图;D在前一帧目标区域的扩大域内对深度信息聚类得深度类别;E根据D获取的深度类别对该区域的超级像素分类以及前景与背景分割;F对E提取的前景根据前一帧的表观模型做分割,提取最终的前景;G若跟踪器处于遮挡状态,则转入I;若没有被遮挡,则返回A,否则跟踪器记录前一帧的目标表观模型,转入H;H提取遮挡原目标的深度块,将跟踪器置于遮挡状态;I在当前遮挡块周围对原目标进行搜索,若发现原目标,跟踪器重新被置于正常状态,则返回A。

    基于同类目标融合数据增广的鲁棒X光图像目标检测方法

    公开(公告)号:CN118968075A

    公开(公告)日:2024-11-15

    申请号:CN202410996894.8

    申请日:2024-07-24

    Applicant: 厦门大学

    Abstract: 本发明公开了基于同类目标融合数据增广的鲁棒X光图像目标检测方法,本方案方法主要基于工作的数据集在标签含有噪声的情况,其可以有效地消除标签噪声对X光安检图像目标检测器训练产生的影响,并且通过图像融合很好的模拟了X光图像中重叠遮挡的情况,让模型可以更好的学习到X光图片的固有特征。该方案不仅在多个公开地数据集上都取得了良好的性能,同时相比于传统的噪声标签学习方法,本方案是一种更加灵活,且贴近实际需求地解决噪声标签情况下X光安检图像目标检测的方案。除此之外,通过实验结果发现,本方案方法不仅在X光数据集中有效,在一些通用目标检测数据集中也有较好的效果。

    一种基于双分支干扰分离网络的人脸表情识别方法

    公开(公告)号:CN113239833B

    公开(公告)日:2023-08-29

    申请号:CN202110551957.5

    申请日:2021-05-20

    Applicant: 厦门大学

    Abstract: 一种基于双分支干扰分离网络的人脸表情识别方法,涉及计算机视觉技术。提供可以处理表情图像中多种干扰因素的一种基于双分支干扰分离网络的人脸表情识别方法。首先设计一个双分支网络来分开学习表情特征和干扰特征,再根据干扰特征的不同类型在干扰分支中设计标签感知子分支和无标签子分支。在标签感知子分支中,利用辅助数据集的标签信息和迁移学习的方式学习常见干扰特征。在无标签子分支中,引入印度自助餐过程理论学习潜在干扰特征。最后,通过对抗学习,进一步分离干扰特征和表情特征,从而获得更有判别力的表情特征进行分类预测,有效地提升表情识别的性能。

    基于阶段性特征语义对齐的实时街景图像语义分割方法

    公开(公告)号:CN113011429B

    公开(公告)日:2023-07-25

    申请号:CN202110295657.5

    申请日:2021-03-19

    Applicant: 厦门大学

    Inventor: 严严 翁熙 王菡子

    Abstract: 一种基于阶段性特征语义对齐的实时街景图像语义分割方法,涉及计算机视觉技术。首先利用轻量级图像分类网络ResNet‑18和高效空间‑通道注意力模块构建编码器,并使用多个不同设计的特征对齐模块模块与全局平均池化层构建解码器。接着,利用上述得到的编码器与解码器,构成基于编码器‑解码器网络结构的语义分割网络模型。最后将编码器中的特征与解码器的输出特征进行聚合并送入语义分割结果生成模块中,以得到最终的语义分割结果。在维持高分辨率的输入图像且不降低图像分辨率的情况下,能够以实时的速率高效地产生对应的分割结果。比起现有的实时语义分割方法,能够取得更加优秀的分割精度,在速度和精度之间取得更好的平衡。

    一种利用短程关联和长程修剪的多目标跟踪与分割方法

    公开(公告)号:CN112132152B

    公开(公告)日:2022-05-27

    申请号:CN202010994613.7

    申请日:2020-09-21

    Applicant: 厦门大学

    Inventor: 王菡子 李玉磊

    Abstract: 一种利用短程关联和长程修剪的多目标跟踪与分割方法,涉及计算机视觉。训练用于分割和跟踪的卷积神经网络,将视频图片输入训练后的网络,得视频图片中每个目标实例对应的分割位置和实例表征向量;使用欧式距离度量不同实例之间表征向量的空间距离及实例掩码中心距离,度量转化成向量相似性得分和掩码中心相似性得分;用实例掩码和边缘框在相邻帧之间的传播得分得掩码相似性得分和边缘框相似性得分;利用四种相似性得分和匈牙利算法得视频中目标实例的运动轨迹;在目标实例轨迹中,使用先前帧的目标实例置信得分对当前帧目标实例置信得分进行调整,并清除实例置信得分低的运动轨迹,得到高置信得分的长程运动轨迹。具有较高精度和鲁棒性。

    一种基于孪生网络的目标特定响应注意力目标跟踪方法

    公开(公告)号:CN111291679B

    公开(公告)日:2022-05-27

    申请号:CN202010081733.8

    申请日:2020-02-06

    Applicant: 厦门大学

    Abstract: 一种基于孪生网络的目标特定响应注意力目标跟踪方法,涉及计算机视觉技术。针对原有的基于孪生网络的目标跟踪方法对目标快速运动、遮挡、旋转、背景杂乱等复杂跟踪场景不够鲁棒的缺点,提出一种基于孪生网络的目标特定响应注意力目标跟踪方法,提出的目标响应注意力模块有效弱化跟踪过程中噪声信息对于跟踪性能的影响,同时强化对目标对象外观变化具有判别性的特征信息,使得孪生网络产生的比较好的目标响应图,使用该目标响应图进行目标位置预测,从而实现更鲁棒的跟踪性能。包含五个主要部分:CNN特征提取;逐通道互相关生成响应图;利用注意力网络产生权重,对各通道响应图加权;最终响应图上确定目标位置,以及所提出模型的训练方法。

    一种全局与局部特征融合的遮挡鲁棒行人重识别方法

    公开(公告)号:CN112200111B

    公开(公告)日:2022-05-17

    申请号:CN202011116582.1

    申请日:2020-10-19

    Applicant: 厦门大学

    Abstract: 一种全局与局部特征融合的遮挡鲁棒行人重识别方法,涉及计算机视觉技术。包括以下步骤:1)训练数据的准备;2)模型设计与训练;模型包括ResNet‑50骨架网络、全局分支、局部分支以及语义分支、全局分支利用SPC损失提取全局特征,局部分支提取局部特征,语义分支预测人体语义标签,三个分支可以联合在一起进行端到端的训练。3)利用训练好的模型来提取行人重识别数据训练集和测试集中所有行人图像的全局特征、局部特征以及预测行人图像的语义标签,并进行非遮挡区域指示符的计算。4)对查询集中的每幅行人图像分别与数据库中的所有行人图像计算相似度,按相似度从大到小排序,从而完成行人重识别。显著提高了识别的性能。

    一种基于多任务卷积神经网络的人脸表情识别方法

    公开(公告)号:CN108764207B

    公开(公告)日:2021-10-19

    申请号:CN201810582457.6

    申请日:2018-06-07

    Applicant: 厦门大学

    Inventor: 严严 黄颖 王菡子

    Abstract: 一种基于多任务卷积神经网络的人脸表情识别方法,首先设计多任务卷积神经网络结构,在网络中依次提取所有表情共享的低层语义特征和多个单表情判别性特征;然后采用多任务学习,同时学习多个单表情判别性特征学习任务以及多表情识别任务,使用一种联合损失来监督网络的所有任务,并且使用两种损失权重来平衡网络的损失;最后根据训练好的网络模型,从模型最后的柔性最大分类层得到最终的人脸表情识别结果。将特征提取与表情分类放在一个端到端的框架中进行学习,从输入图片中提取出判别性特征,对输入图片做出可靠地表情识别。通过实验分析可知,本算法性能卓越,可有效地区分复杂的人脸表情,在多个公开的数据集上都取得了良好的识别性能。

Patent Agency Ranking