-
公开(公告)号:CN113011429A
公开(公告)日:2021-06-22
申请号:CN202110295657.5
申请日:2021-03-19
Applicant: 厦门大学
Abstract: 一种基于阶段性特征语义对齐的实时街景图像语义分割方法,涉及计算机视觉技术。首先利用轻量级图像分类网络ResNet‑18和高效空间‑通道注意力模块构建编码器,并使用多个不同设计的特征对齐模块模块与全局平均池化层构建解码器。接着,利用上述得到的编码器与解码器,构成基于编码器‑解码器网络结构的语义分割网络模型。最后将编码器中的特征与解码器的输出特征进行聚合并送入语义分割结果生成模块中,以得到最终的语义分割结果。在维持高分辨率的输入图像且不降低图像分辨率的情况下,能够以实时的速率高效地产生对应的分割结果。比起现有的实时语义分割方法,能够取得更加优秀的分割精度,在速度和精度之间取得更好的平衡。
-
公开(公告)号:CN108898620B
公开(公告)日:2021-06-18
申请号:CN201810619827.9
申请日:2018-06-14
Applicant: 厦门大学
Abstract: 基于多重孪生神经网络与区域神经网络的目标跟踪方法,涉及计算机视觉技术。通过使用预训练的多重孪生神经网络,将目标跟踪问题转化为可更新的实例检索问题。同时采用预训练的区域神经网络,以解决目标丢失后的重检测问题。首先在大型视觉识别数据库上训练多重孪生神经网络对目标进行实例检索,然后在目标跟踪过程中运用预训练的区域神经网络对丢失目标进行重新检测,进一步辅助获取最终目标的位置,实现实时的目标跟踪。首先在大型视觉识别数据库上训练多重孪生神经网络对目标进行实例检索,然后在目标跟踪过程中运用预训练的区域神经网络对丢失目标进行重新检测,进一步辅助获取最终目标的位置,实现实时的目标跟踪的。
-
公开(公告)号:CN112308877A
公开(公告)日:2021-02-02
申请号:CN202011165026.3
申请日:2020-10-27
Applicant: 厦门大学
Abstract: 基于异质模型拟合的运动分割方法,涉及计算机视觉技术。首先,使用基于密度估计技术的投票方法,通过对异质模型假设质量的评价,生成高质量的累积相关矩阵。在此基础上,利用信息论构造稀疏亲和矩阵的方法,有效地抑制了不同目标之间的关联值。最后,利用归一化谱聚类算法对融合后的稀疏亲和矩阵进行分割,得到准确的分割结果。解决现有技术存在的真实场景中外界的光照变化、运动物体的表观和遮挡,可能会导致跟踪点包含异常值和噪声等问题。
-
公开(公告)号:CN108898621B
公开(公告)日:2021-01-12
申请号:CN201810662407.9
申请日:2018-06-25
Applicant: 厦门大学
IPC: G06T7/246
Abstract: 一种基于实例感知目标建议窗口的相关滤波跟踪方法,能够在基于CNN的相关滤波框架中根据检测的稳定性自适应地选择尺度估计模式以及目标重检测模式,提高算法在尺度估计、快速运动、遮挡、背景干扰等方面的鲁棒性。由EdgeBoxes生成的目标建议窗口基于表观相似度和空间加权排序后得到的都是与目标实例具有高相似度的目标建议窗口,称为实例感知目标建议窗口。实例感知的目标建议窗口由基于CNN的相关滤波器进一步引导至最优位置,从中选取最显著的经引导后的实例感知目标建议窗口,作为目标的尺度估计或者重检测结果,可有效地解决跟踪过程中的尺度变化以及目标丢失。在标准数据集上,提出的方法获得很高的性能指标。
-
公开(公告)号:CN112200260A
公开(公告)日:2021-01-08
申请号:CN202011116242.9
申请日:2020-10-19
Applicant: 厦门大学
Abstract: 一种基于丢弃损失函数的人物属性识别方法,涉及基于内容的图像识别。首先设计基于ResNet‑50的深度卷积神经网络,然后设计丢弃损失函数中包含的离群样本丢弃策略,计算梯度值,选择性丢弃梯度值大于一定阈值的样本权重,再设计丢弃损失函数中包含的样本加权丢弃策略,选择性丢弃其梯度值最小的一部分样本,通过对样本加权的方式来平衡其正负类别的样本的分布,最后将训练样本集中的图像放进基于ResNet‑50的深度卷积神经网络计算得到总体损失,并利用反向传播算法进行端到端的训练,利用训练好的模型进行多属性识别,神经网络输出的特征即为识别结果。性能卓越,可有效识别图片中的多个属性,在平衡精度标准上有明显优势。
-
公开(公告)号:CN112200110A
公开(公告)日:2021-01-08
申请号:CN202011116207.7
申请日:2020-10-19
Applicant: 厦门大学
Abstract: 一种基于深度干扰分离学习的人脸表情识别方法,涉及计算机视觉技术。包括以下步骤:A.准备样本集;B.对于干扰样本集的所有样本,使用多任务学习的方法预训练一个干扰特征提取模型;C.对于表情训练样本集中的所有样本,设计并训练一个干扰分离模型;D.在干扰分离模型的表情子网络和干扰子网络中分别设计一系列注意力模块;E.设计表情子网络;F.使用K‑L散度约束干扰子网络学习;G.在测试阶段,针对表情测试样本集,利用干扰分离模型提取人脸表情特征并实现鲁棒的人脸表情识别。能够从特征层面上同时分离出各种对表情识别有影响的干扰因素,可以有效地进行人脸表情识别,可以提高人脸表情识别的精度。
-
公开(公告)号:CN112132761A
公开(公告)日:2020-12-25
申请号:CN202010972204.7
申请日:2020-09-16
Applicant: 厦门大学
IPC: G06T5/00
Abstract: 一种基于循环上下文聚合网络的单图像去雾方法,涉及计算机视觉技术。步骤:A.准备训练样本集(xi,yi),i=1,……,N,N为训练样本数,N为自然数。xi表示训练样本对应的固定大小的图像。yi表示训练样本xi对应的真实图像;B.预处理训练样本集;C.设计循环上下文聚合网络结构;D.设计上下文聚合块;E.在循环上下文聚合网络里,采用循环跳跃连接,避免训练中出现梯度爆炸或者梯度消失问题,加速循环网络的训练。建立深度网络框架,包括编码模块、循环模块、解码模块;可有效进行单图像去雾,通过算法分析,不仅大大提高了去雾的性能,而且还保存着图像的纹理和细节,在视觉上也取得最好的效果。
-
公开(公告)号:CN111666948A
公开(公告)日:2020-09-15
申请号:CN202010458635.1
申请日:2020-05-27
Applicant: 厦门大学
Abstract: 一种基于多路聚合的实时高性能语义分割方法和装置,所述方法包括:准备语义分割图像训练集和测试数据集;对数据集图像进行下采样;将现有的轻量级分类网络改造为语义分割的基础特征提取网络;将基础特征提取网络所提取的特征图按大小分为4个尺度,取较小的三个尺度的特征图输入到不同分支路径中进行处理以构成多路网络;并用全局上下文模块处理最小尺度的特征图;利用特征变换模块对特征图进行变换,并按尺度的从低至高逐级聚合前两个步骤中得到的特征图形成预测结果;将预测结果与训练集提供的像素级标注图像进行对比,并使用反向传播算法进行训练以得到实时高性能语义分割网络模型;把测试数据集的图像输入至训练好的模型中得到分割结果。
-
公开(公告)号:CN111291679A
公开(公告)日:2020-06-16
申请号:CN202010081733.8
申请日:2020-02-06
Applicant: 厦门大学
Abstract: 一种基于孪生网络的目标特定响应注意力目标跟踪方法,涉及计算机视觉技术。针对原有的基于孪生网络的目标跟踪方法对目标快速运动、遮挡、旋转、背景杂乱等复杂跟踪场景不够鲁棒的缺点,提出一种基于孪生网络的目标特定响应注意力目标跟踪方法,提出的目标响应注意力模块有效弱化跟踪过程中噪声信息对于跟踪性能的影响,同时强化对目标对象外观变化具有判别性的特征信息,使得孪生网络产生的比较好的目标响应图,使用该目标响应图进行目标位置预测,从而实现更鲁棒的跟踪性能。包含五个主要部分:CNN特征提取;逐通道互相关生成响应图;利用注意力网络产生权重,对各通道响应图加权;最终响应图上确定目标位置,以及所提出模型的训练方法。
-
公开(公告)号:CN108520530B
公开(公告)日:2020-01-14
申请号:CN201810323668.8
申请日:2018-04-12
Applicant: 厦门大学
Abstract: 基于长短时记忆网络的目标跟踪方法,涉及计算机视觉技术。首先采用基于相似性学习的快速匹配方法对候选目标状态进行预估计,筛选出高质量的候选目标状态,然后将这些高质量的目标状态用长短时记忆网络进行分类。所用的长短时记忆网络包括用于提取特征的卷积层和用于分类的长短时记忆层。卷积层在大规模图像数据集ILSVRC15上离线训练而得,规避了对目标跟踪数据集过拟合的风险。长短时记忆层通过在线学习而得,充分利用了输入视频序列包含的时间相关性,具有良好的适应目标形态和动作变化的能力。速度显著提高,将一种可以适应目标变化的长短时记忆网络运用于目标跟踪。
-
-
-
-
-
-
-
-
-