-
公开(公告)号:CN110135366B
公开(公告)日:2021-04-13
申请号:CN201910418070.1
申请日:2019-05-20
Applicant: 厦门大学
Abstract: 基于多尺度生成对抗网络的遮挡行人重识别方法,涉及计算机视觉技术。准备行人图像训练集;设计和训练一个多尺度生成对抗网络,该网络包括多尺度生成器和判别器两部分,其中,多尺度生成器能够对随机遮挡区域进行去遮挡操作,生成高质量的重构图;而判别器能够区分输入图像是真实图像还是生成图像;利用训练好的多尺度生成器产生扩充的行人图像训练集;设计和训练一个分类识别网络,该网络用于对输入的行人图像进行身份分类;利用训练好的分类识别网络提取行人图像的特征并进行相似度匹配。
-
公开(公告)号:CN110148159B
公开(公告)日:2021-03-26
申请号:CN201910418073.5
申请日:2019-05-20
Applicant: 厦门大学
IPC: G06T7/246
Abstract: 一种基于事件相机的异步目标跟踪方法,涉及计算机视觉技术。包含三个主要部分:开始的目标检测模块、目标跟踪模块和恢复跟踪模块;所述开始的目标检测模块用于提取ATSLTD帧上的目标建议窗口;所述目标跟踪模块根据最小化目标时空不一致信息原则选择最佳的目标建议窗口作为跟踪结果;所述恢复跟踪模块用于跟踪失败时恢复对目标的跟踪。该方法能够有效地应对目标跟踪中存在的目标快速运动和高动态范围场景等问题,取得了优于主流基于传统相机的目标跟踪算法的精度。
-
公开(公告)号:CN110188817B
公开(公告)日:2021-02-26
申请号:CN201910452356.1
申请日:2019-05-28
Applicant: 厦门大学
Abstract: 一种基于深度学习的实时高性能街景图像语义分割方法。准备街景图像训练、验证和测试数据集;对数据集图像进行下采样,减小图像的分辨率;对现有的轻量级分类网络进行改造作为语义分割的基础特征提取网络;在基础特征提取网络后串联一个鉴别性孔洞空间金字塔池化用于解决语义分割的多尺度问题;将若干个卷积层堆叠,形成浅层的空间信息保存网络;使用特征融合网络将得到的特征图进行融合形成预测结果;将输出图像与数据集中的语义标注图像进行对比,利用反向传播算法进行端到端的训练,得到实时高性能街景图像语义分割网络模型;将待测试的街景图像输入实时高性能街景图像语义分割网络模型中得到街景图像的语义分割结果。
-
公开(公告)号:CN112287999A
公开(公告)日:2021-01-29
申请号:CN202011166826.7
申请日:2020-10-27
Applicant: 厦门大学
Abstract: 利用卷积神经网络矫正梯度的弱监督目标定位方法,涉及计算机视觉技术领域。在给定的只包含类别标签的数据集上训练好一个用于分类功能的卷积神经网络,先对网络进行正向传递,然后指定待定位的目标的类别,进行卷积神经网络矫正梯度的反向传递,即从输出层向输入层逐层反向传递梯度,并且进行相应的矫正操作。卷积神经网络矫正梯度的反向传递包含对网络中全连接层、卷积层等传递的梯度进行了矫正。生成的热图中目标轮廓清晰,获取的定位精度高,同时能够区分不同类别的目标,定位的区域含有较少无关背景。对含有负值特征的模型具有鲁棒性。
-
公开(公告)号:CN112084954A
公开(公告)日:2020-12-15
申请号:CN202010948845.9
申请日:2020-09-10
Applicant: 腾讯科技(深圳)有限公司 , 厦门大学
Abstract: 本发明提供了一种视频目标的检测方法、装置、电子设备以及存储介质,方法包括:确定待检测视频中的待检测视频帧,并获取与所述待检测视频帧相匹配的视频序列中的辅助视频帧;基于所述待检测视频帧与所述辅助视频帧,通过视频处理模型中的特征提取网络确定帧级别的特征向量;基于所述帧级别的特征向量,通过所述视频处理模型的候选框生成网络,确定实例级别的特征向量;通过所述视频处理模型中的检测头网络,根据所述实例级别的特征向量,对所述待检测视频进行目标检测,确定视频目标在所述待检测视频的不同视频帧中的所在区域,由此,由此实现鲁棒并精确地对视频中的目标进行检测,减少视频目标检测中的失真。
-
公开(公告)号:CN108564029B
公开(公告)日:2020-12-01
申请号:CN201810323645.7
申请日:2018-04-12
Applicant: 厦门大学
Abstract: 基于级联多任务学习深度神经网络的人脸属性识别方法,涉及计算机视觉技术。首先设计级联的深度卷积神经网络,然后在级联的深度卷积神经网络里,对于每一个级联的子网络,采用多任务学习,同时学习人脸分类、边框回归、人脸关键点检测、人脸属性分析四个任务,接着在基于级联多任务学习的深度卷积神经网络里,采用一种动态损失权重机制,来计算人脸属性的损失权重,最终根据训练好的网络模型,将级联的最后一个子网络的人脸属性识别结果作为最终的人脸属性识别结果。使用级联的方法联合训练了三个不同的子网络,达到了端到端的训练,优化了人脸属性识别的结果,不同于在损失函数里使用固定的损失权重,本发明考虑到不同人脸属性间的差异性。
-
公开(公告)号:CN111914107A
公开(公告)日:2020-11-10
申请号:CN202010746717.6
申请日:2020-07-29
Applicant: 厦门大学
Abstract: 一种基于多通道注意力区域扩展的实例检索方法,涉及图像检索技术领域。首先提出多通道注意力区域扩展模块,在网络训练中仅依赖图像类别标签,从多个通道进行注意力区域扩展操作,分别实现对图像中的多个实例进行相对完整的定位。根据定位进行特征提取的过程中,引入多分支联合训练,在提取特征时保留原信息,并进一步获得深层语义信息,增强特征的判别力。不同于已有的技术,只依赖图像类别标签训练卷积神经网络,基于类激活图和注意力区域扩展模块对图像中实例进行定位的同时,提取具有判别性的实例特征用于实例检索。可应用到电商网站的在线购物、视频媒体的智能化检索等现实场景。
-
公开(公告)号:CN108257148B
公开(公告)日:2020-09-25
申请号:CN201810046395.7
申请日:2018-01-17
Applicant: 厦门大学
Abstract: 特定对象的目标建议窗口生成方法及其在目标跟踪的应用,涉及计算机视觉技术。给定一帧训练视频,将该图像分成三个区域:完全的目标区域,完全的背景区域以及目标和背景的混合区域。对完全的目标区域和完全的背景区域分别计算目标像素和背景像素的概率分布图,更新目标像素和背景像素的概率分布图模型。给定一帧测试视频,利用训练好的概率分布图来预测图像中每个像素属于目标的概率,得到概率响应图。对原图和概率响应图分别提取目标建议窗口,把这些目标建议窗口都作为候选的目标建议窗口。对得到的目标建议窗口基于与对象的相似度进行排序,生成特定对象的目标建议窗口。把特定对象的目标建议窗口作为MDNET的训练样本实现目标跟踪。
-
公开(公告)号:CN110443189A
公开(公告)日:2019-11-12
申请号:CN201910704048.3
申请日:2019-07-31
Applicant: 厦门大学
Abstract: 基于多任务多标签学习卷积神经网络的人脸属性识别方法,涉及计算机视觉技术。首先采用多任务学习,同时学习人脸关键点检测和人脸属性识别两个任务;考虑不同属性的学习难度和学习收敛速度不同,将属性分为主观属性和客观属性,采用动态权重和自适应阈值策略来加快网络的收敛速度和缓解样本不平衡问题;最终根据训练好的网络模型,将主观属性和客观属性子网络的人脸属性识别结果作为最终的人脸属性识别结果。使用动态权重方案和自适应阈值调整,加快网路收敛速度的同时可缓解标签不平衡问题;采用空间金字塔池化的方法训练三个不同的子网络,达到了端到端的训练进行多任务多人脸属性识别。提高人脸属性识别的精度,尤其是难度较大的主观属性。
-
公开(公告)号:CN106203533B
公开(公告)日:2019-09-20
申请号:CN201610592954.5
申请日:2016-07-26
Applicant: 厦门大学
Abstract: 基于混合训练的深度学习人脸验证方法。准备人脸数据集;对每幅图像进行人脸和人脸关键点检测;对所有人脸归一化,得人脸图像训练集,再划分为训练和验证数据集,计算所有人脸图像的均值图像;将所有人脸图像都减去均值图像得均值化的训练数据集和验证数据集;训练深度卷积神经网络;对每幅人脸图像生成对应的三元组,构成三元组训练数据集和三元组验证数据集;再次训练深度卷积神经网络;对于给定待验证的两幅图像进行人脸和人脸特征点检测,并减去均值图像,输入深度卷积神经网络中,进行网络前馈操作,并提取特征;根据选定的阈值,当两幅图像提取特征之间的距离大于阈值,判定两张图像中的人脸属于同一个人,否则判定为不同人。
-
-
-
-
-
-
-
-
-