-
公开(公告)号:CN114936977A
公开(公告)日:2022-08-23
申请号:CN202210610204.1
申请日:2022-05-31
申请人: 东南大学
摘要: 本发明公开了一种基于通道注意力和跨尺度特征融合的图像去模糊方法,包括:根据公开的模糊图像数据集,构建训练集、验证集和测试集;构建基于通道注意力和跨尺度特征融合的图像去模糊网络模型,利用所构建的训练集对模型进行监督训练,得到收敛的去模糊网络模型;在所构建的模糊图像测试集上评估本发明所提网络模型的去模糊性能。本发明所提方法相比于DMPHN等算法取得了更好的去模糊性能。本发明在降低网络整体参数量,极大减少前向推理时间的同时取得了更高的峰值信噪比和结构相似性,提升了图像去模糊的效果。
-
公开(公告)号:CN115147639A
公开(公告)日:2022-10-04
申请号:CN202210558590.4
申请日:2022-05-20
申请人: 东南大学
IPC分类号: G06V10/764 , G06V10/774 , G06V10/82 , G06T3/00 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种基于域自适应机制的复杂背景下的目标检测方法,包括:获取公开的通用目标检测数据集和复杂背景目标检测数据集,构建源域训练集、目标域训练集和测试集;构建基于域自适应机制的人工神经网络模型ForegroundNet‑DA模型;在源域训练集和目标域训练集上对ForegroundNet‑DA模型的部分参数进行域自适应阶段的预训练;在目标域训练集上对ForegroundNet‑DA模型进行精调阶段的训练;在所构建的测试集上评估收敛的ForegroundNet‑DA模型的检测性能。本发明与当前所有的复杂背景目标检测算法相比,能在较小规模的数据集支撑下,实现更加精确的检测性能。本发明在测试集上的检测结果对应的平均绝对误差更低,增强对齐指标、结构指标及加权的F指标更高,是一种更加精确的复杂背景下的目标检测算法。
-
公开(公告)号:CN114882241A
公开(公告)日:2022-08-09
申请号:CN202210558583.4
申请日:2022-05-20
申请人: 东南大学
摘要: 本发明公开了一种基于卷积注意力机制的复杂背景下的目标检测方法,可用于对复杂背景下的前景目标进行精确检测。该发明主要包括:获取公开的复杂背景下目标检测数据集,构建训练集、验证集和测试集;构建基于卷积注意力机制的人工神经网络模型ForegroundNet模型;在Pytorch深度学习平台上使用训练集对ForegroundNet网络模型进行监督训练;在所构建的测试集上评估收敛的ForegroundNet模型的检测性能。本发明与当前主要的复杂背景目标检测算法相比,能够对前景目标的边缘区域进行精确检测,从而实现更高的检测性能。本发明在测试集上的检测结果对应的平均绝对误差更低,增强对齐指标、结构指标及加权的F指标更高,是一种更加精确的复杂背景下的目标检测算法。
-
公开(公告)号:CN114663953B
公开(公告)日:2024-11-12
申请号:CN202210318271.6
申请日:2022-03-29
申请人: 东南大学
IPC分类号: G06V40/16 , G06V10/764 , G06V10/82 , G06N3/045 , G06N3/042 , G06N3/0464 , G06N3/09
摘要: 本发明公开了一种基于面部关键点和深度神经网络的人脸表情识别方法,可用于实现对人脸面部表情的实时检测。该发明主要包括:获取人脸表情数据集,通过预处理提取出68个面部关键点,并对眼部、鼻部、嘴部区域进行划分,以此分别获得多路图像数据以及关键点坐标数据;训练表情分类网络,对图像数据和坐标数据分别采用卷积层和图卷积层提取特征,输出分类结果;在人脸表情分类数据集上评估网络的识别效果。本发明相比于当前主要的人脸面部表情分类算法,在保证识别实时性的前提下,获得了更高的平均分类准确率,是一种高质量的人脸面部表情识别算法。
-
公开(公告)号:CN115171180A
公开(公告)日:2022-10-11
申请号:CN202210598202.5
申请日:2022-05-30
申请人: 东南大学
IPC分类号: G06V40/16 , G06V10/82 , G06V10/774 , G06V10/764 , G06V10/24 , G06V10/44 , G06V10/26 , G06V10/77 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种基于空间注意力和深度神经网络的人脸表情识别方法,可用于实现对人脸面部表情的实时检测。该发明主要包括:获取人脸表情数据集,按一定比例划分为训练集、验证集、测试集后,提取出图像中的人脸部分,并进行旋转、水平翻转、裁剪、色彩抖动等数据增强操作;训练表情分类网络,使用基于逆向残差层与的卷积神经网络提取图像特征后,通过空间注意力机制对图像各区域的重要性进行区分,并基于得到的特征对人脸图像进行表情分类;在人脸表情分类数据集上评估网络的识别效果。本发明相比于当前主要的人脸面部表情分类算法,获得了更高的平均分类准确率,且算法实时性高,是一种高质量的人脸面部表情识别算法。
-
公开(公告)号:CN114663953A
公开(公告)日:2022-06-24
申请号:CN202210318271.6
申请日:2022-03-29
申请人: 东南大学
摘要: 本发明公开了一种基于面部关键点和深度神经网络的人脸表情识别方法,可用于实现对人脸面部表情的实时检测。该发明主要包括:获取人脸表情数据集,通过预处理提取出68个面部关键点,并对眼部、鼻部、嘴部区域进行划分,以此分别获得多路图像数据以及关键点坐标数据;训练表情分类网络,对图像数据和坐标数据分别采用卷积层和图卷积层提取特征,输出分类结果;在人脸表情分类数据集上评估网络的识别效果。本发明相比于当前主要的人脸面部表情分类算法,在保证识别实时性的前提下,获得了更高的平均分类准确率,是一种高质量的人脸面部表情识别算法。
-
-
-
-
-