-
公开(公告)号:CN112200260B
公开(公告)日:2022-06-14
申请号:CN202011116242.9
申请日:2020-10-19
Applicant: 厦门大学
IPC: G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 一种基于丢弃损失函数的人物属性识别方法,涉及基于内容的图像识别。首先设计基于ResNet‑50的深度卷积神经网络,然后设计丢弃损失函数中包含的离群样本丢弃策略,计算梯度值,选择性丢弃梯度值大于一定阈值的样本权重,再设计丢弃损失函数中包含的样本加权丢弃策略,选择性丢弃其梯度值最小的一部分样本,通过对样本加权的方式来平衡其正负类别的样本的分布,最后将训练样本集中的图像放进基于ResNet‑50的深度卷积神经网络计算得到总体损失,并利用反向传播算法进行端到端的训练,利用训练好的模型进行多属性识别,神经网络输出的特征即为识别结果。性能卓越,可有效识别图片中的多个属性,在平衡精度标准上有明显优势。
-
公开(公告)号:CN113011336B
公开(公告)日:2022-05-27
申请号:CN202110297170.0
申请日:2021-03-19
Applicant: 厦门大学
Abstract: 一种基于深度多分支聚合的实时街景图像语义分割方法,涉及计算机视觉技术。采用流行的编码器‑解码器结构;首先采用轻量级的图像分类网络作为基础,将其改造作为编码器;然后将编码器分为不同的子网络,并将各子网络中的特征分别送入设计的多分支特征聚合网络中和全局上下文模块;接着在多分支特征聚合网络中利用格型增强残差模块和特征变换模块对需要聚合的特征进行空间细节和语义信息上的增强;最后按照特征图的大小,从小到大逐级聚合全局上下文模块的输出特征图和多分支特征聚合网络的输出特征图,以得到最终的语义分割结果图。在处理较大分辨率的街景图像的同时,保持较高的街景图像语义分割精度和实时的预测速度。
-
公开(公告)号:CN113313736B
公开(公告)日:2022-05-17
申请号:CN202110649381.6
申请日:2021-06-10
Applicant: 厦门大学
IPC: G06T7/246 , G06T7/62 , G06T7/66 , G06T7/73 , G06V40/10 , G06V10/44 , G06V10/75 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 统一目标运动感知和重识别网络的在线多目标跟踪方法,涉及计算机视觉技术。A.将当前帧图像与前一帧图像输入到骨干网络,获得两帧图像的特征图;B.将前一帧图像的热力图与步骤A两个特征图送入检测与跟踪分支,得计算当前帧检测结果及目标跟踪偏移量;C.将步骤A两帧图像的特征图送入重识别分支,得嵌入特征向量,存储于重识别特征向量池中;D.根据跟踪偏移量,对步骤B获得的检测结果进行第一次匹配,为已匹配的检测分配对应目标的身份识别;E.对步骤D获得的未匹配检测结果进行第二次匹配,将未匹配检测结果与步骤C获得的嵌入特征向量逐一进行相似性计算,根据设定的阈值,为不同检测结果分配身份识别,即得当前帧最终的跟踪结果。
-
公开(公告)号:CN114330580A
公开(公告)日:2022-04-12
申请号:CN202111676330.9
申请日:2021-12-31
IPC: G06K9/62
Abstract: 本发明公开了基于歧义指导互标签更新的鲁棒知识蒸馏方法,包括:A、构建训练数据集;B、构建教师网络和学生网络;C、通过鲁棒学习方法对教师网络进行训练;D、对数据集中的每个样本进行歧义感知权重估计和权重分配;E、根据小损失标准对数据集中的样本进行标签重新标注,结合教师网络特征的标签传播算法更新标签,再计算损失和更新网络参数;F、在学生网络和教师网络之间进行互标签传播算法,并更新样本标签、计算损失和更新网络参数;G、将测试图像数据导入学生网络,由其得到预测结果且用于图像分类;本方案可以有效地提升知识蒸馏对噪声标签的鲁棒性,从而可以在噪声标签的环境下获取一个高性能的轻量级网络,其更能适用于实际情况。
-
公开(公告)号:CN109508669B
公开(公告)日:2021-07-23
申请号:CN201811332661.9
申请日:2018-11-09
Applicant: 厦门大学
Abstract: 一种基于生成式对抗网络的人脸表情识别方法,涉及计算机视觉技术。首先设计一个基于生成式对抗网络的人脸表情生成网络并对其预训练,该网络由一个生成器和两个判别器构成,能够生成指定表情的随机身份的人脸图;然后设计一个人脸表情识别网络,该网络在训练时同时接收训练集中的真实人脸表情图以及由人脸表情生成网络产生的随机人脸表情图,使用一种类内损失来减少真实样本和生成样本之间的人脸表情特征差异性;同时还使用一种真实样本导向的梯度更新方法来促进生成样本的特征学习;最后根据训练好的人脸表情识别网络模型,从模型最后的柔性最大分类层得到最终的人脸表情识别结果。
-
公开(公告)号:CN112966581A
公开(公告)日:2021-06-15
申请号:CN202110213113.X
申请日:2021-02-25
Applicant: 厦门大学
Abstract: 一种基于内外语义聚合的视频目标检测方法,涉及计算机视觉技术。包括步骤:A.准备训练样本集,依次包括当前帧、支持帧,首先在当前序列随机选取一帧作为当前帧,再在当前帧附近随机选取几帧作为支持帧,为当前帧的训练提供丰富的时空信息。B.预处理训练样本集,对当前帧,支持帧进行随机翻转、裁剪等操作,进一步增大训练样本多样性。C.在每帧内进行内部语义聚合,实现单个帧自身的空间语义增强。D.联合三帧进行外部语义聚合,实现三帧时空信息的语义增强。E.对经过内外语义聚合的当前帧特征进行分类和回归,得到最后的检测结果,包括检测框和预测所属类别。可以有效地聚合视频中的时空语义信息,从而有效地提高目标检测器的性能。
-
公开(公告)号:CN112132204A
公开(公告)日:2020-12-25
申请号:CN202010987428.5
申请日:2020-09-18
Applicant: 厦门大学
IPC: G06K9/62
Abstract: 一种基于偏好概率加权采样的鲁棒模型拟合方法,涉及计算机视觉。A.准备数据集;B.赋予数据集中每个数据点权重,循环执行步骤C‑D,生成模型假设;C.从数据点中以权重采样数据点子集,进行模型更新策略,在数据集中通过随机采样生成初始模型假设,并通过迭代方式更新模型假设,直到满足停止标准停止迭代,通过更新选取得到最佳模型假设并加入模型假设集;D.根据偏好概率公式和模型假设集计算各数据点的偏好概率,通过增大偏好概率在一定阈值区间的数据点权重,增加采样小结构模型实例内点概率,减少大结构模型实例和离群点对采样干扰;E.用模型假设集的残差向量集,构建相似度矩阵,应用谱聚类技术对数据聚类,估计多结构模型实例。
-
公开(公告)号:CN112131991A
公开(公告)日:2020-12-25
申请号:CN202010967054.0
申请日:2020-09-15
Applicant: 厦门大学
Abstract: 一种基于事件相机的数据关联方法,涉及计算机视觉。将事件相机感应环境中物体运动生成的异步时空视觉事件序列聚合成视觉事件的集合;将时空三维空间在时间维度上切片,在最早和最晚的两个切片上穷举采样,生成对应的直线模型假设集合,选出代表性模型假设集合,对每一个模型假设生成模型假设的内点集合;对代表性模型假设集合内每一个模型假设,计算内点集合在时间轴上的离差,对每个代表性模型假设赋予相应的权重;根据内点集合投影在图像平面生成的视觉事件图像的对比度进一步加权;在权重的肘点处将代表性模型假设集合选择区分为正确和错误的模型假设,正确的模型假设对应场景内的所有物体的运动轨迹。可用于目标跟踪、运动分割等。
-
公开(公告)号:CN111914109A
公开(公告)日:2020-11-10
申请号:CN202010745141.1
申请日:2020-07-29
Applicant: 厦门大学
IPC: G06F16/532 , G06N3/04 , G06N3/08
Abstract: 一种基于深度度量学习的服装检索技术,涉及基于内容的图像检索领域。包括以下步骤:1)模型设计:将一批服装图片经过卷积神经网络及全连接层得到特征嵌入;2)采样方法:按照余弦相似度即已知的正负样本对的相似度信息,选取训练样本图片样本对;3)损失函数:将步骤2)采样方法选取出来的图片样本对,带入设计的损失函数中计算损失,反传以训练模型。利用卷积神经网络后接全连接层的设计来提取图片特征,性能良好且简单、参数少;采样方法可有效挖掘简单和困难样本对所携带的信息,同时防止无限制得惩罚以破坏嵌入空间的整体结构性。损失函数可随着训练过程调整困难样本对的损失大小,以充分学习到简单样本对和困难样本对的信息。
-
公开(公告)号:CN109859241B
公开(公告)日:2020-09-18
申请号:CN201910019982.1
申请日:2019-01-09
Applicant: 厦门大学
IPC: G06T7/246
Abstract: 自适应特征选择和时间一致性鲁棒相关滤波视觉跟踪方法,涉及计算机视觉技术。将弹性网络和时间一致性约束同时引入到相关滤波学习中,能够自适应地选择判别性特征抑制干扰特征,同时,能够将模型的学习与更新结合在一起,能够有效地缓解传统相关滤波器判别性不强以及随时间退化的问题,提高算法对遮挡、形变、旋转以及背景干扰的鲁棒性。通过弹性网络和时间一致性约束,相关滤波器自适应地选择时间上连续的、具有区域特性的判别性特征。推导出的相关滤波学习问题能够通过ADMM求解,仅仅用少数几次迭代就能高效地求解该问题。能够取得较好的性能,精度高,速度快。
-
-
-
-
-
-
-
-
-