-
公开(公告)号:CN111160179A
公开(公告)日:2020-05-15
申请号:CN201911323121.9
申请日:2019-12-20
Applicant: 南昌大学
Abstract: 本发明公开了一种基于头部分割和卷积神经网络的摔倒检测方法,包括如下步骤:步骤A,采集目标对象的视频图像信息,步骤B,将收集到的图像进行处理,并使用两个不同的椭圆分别表示头部与躯干,步骤C,从每帧中的两个椭圆分别提取长短轴比率、方向角以及垂直速度三个特征,并基于时间序列融合为运动特征,步骤D,进行摔倒检测,找出头部和躯干轮廓特征之间的相关性,实现摔倒检测和区分类似活动的目的,步骤E,分析实验结果。本发明公开的一种基于头部分割和卷积神经网络的摔倒检测方法,具有更高的检测率,可以有效地区分一些类似的活动。
-
公开(公告)号:CN119942620A
公开(公告)日:2025-05-06
申请号:CN202510424098.1
申请日:2025-04-07
Applicant: 南昌大学
IPC: G06V40/16 , G06V10/764 , G06V10/82 , G06N3/0464
Abstract: 本申请公开了一种微表情分析方法及系统,属于计算机视觉技术领域。其中方法包括:获取微表情数据集并预处理,得到目标数据集;构建多尺度残差通道注意力网络模型,根据所述目标数据集对所述多尺度残差通道注意力网络模型进行训练和测试;将待分析图像流输入测试后的所述多尺度残差通道注意力网络模型进行分析,输出所述待分析图像流的定位数据和识别数据;对所述定位数据和所述识别数据进行处理,得到所述待分析图像流的微表情区间以及所述微表情区间的微表情类别。综合使用多尺度共享子网络和残差连接通道注意力模块的设计,多尺度残差通道注意力网络模型能够在微表情的定位与识别方面提供更高的准确率。
-
公开(公告)号:CN119624753A
公开(公告)日:2025-03-14
申请号:CN202411530236.6
申请日:2024-10-30
Applicant: 南昌大学
IPC: G06T3/04 , G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/094 , G06V40/16 , G06V10/82
Abstract: 本发明公开了一种基于特征信息映射和注意力机制的人脸特征转换方法,包括:1)构建人脸特征编辑模型;所述人脸特征编辑模型包括生成器、判别器和损失网络;2)以待转换的目标域标签和原始图像作为模型的输入,输出转换后的生成图像;首先目标域标签被生成器中的特征信息映射网络转化为深度特征信息的数据,然后在原始图像转换为生成图像的过程中添加到图像生成网络中实现转换,最后生成图像进入到判别器中进行评估,评价所生成图像的真实程度。本发明方法通过对生成器结构和判别器的结构进行修改,构建了一个模型内部的循环结构,不仅有助于图像的正确生成;并且通过加入注意力掩码生成网络和上下文损失,提高对图像原始信息保留的性能。
-
公开(公告)号:CN119206612A
公开(公告)日:2024-12-27
申请号:CN202411263405.4
申请日:2024-09-10
Applicant: 南昌大学
IPC: G06V20/52 , G06V10/766 , G06V10/82 , G06T7/73 , G06N3/0895 , G06V40/10
Abstract: 本发明公开了一种基于交叉型窗口自注意力机制的弱监督人群计数方法,包括:1)采用交叉型窗口自注意力机制对目标图片进行特征提取;2)引入基于全局平均池化和回归Token的CSWinCrowd结构;3)设计基于可学习位置编码模块的CSWinCrowd‑Token方案;4)结合步骤S1‑S3,提出一种基于CSWinTransformer的人群计数模型,用于目标图片的人群计数。本发明方法能够较好地捕捉序列中不同位置之间的依赖关系,解决了当前Transformer模型在人群密度变化较大时,计数效果不佳的问题。
-
公开(公告)号:CN117315614B
公开(公告)日:2024-03-29
申请号:CN202311597170.8
申请日:2023-11-28
Applicant: 南昌大学
IPC: G06V20/56 , G06V10/44 , G06V10/764 , G06V10/774 , G06V10/776 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本发明公开了一种基于改进YOLOv7的交通目标检测方法,包括:构建交通目标检测网络模型,并在YOLOv7网络结构的骨干特征提取网络中采用ReduceBlock模块替换原始卷积进行深层特征提取,以及在YOLOv7网络结构的头部预测模块中嵌入SimCAM模块加深对关键特征的提取,并更换边界框回归损失函数为FocalDIoU函数;建立训练集和验证集,用于交通目标检测网络模型进行训练学习和检测验证;使用递归热启动策略对交通目标检测网络模型进行训练,并对所述训练集和/或所述验证集进行检测、输出交通目标检测结果。本发明在小幅度增加参数量和计算量的情况下,达到运算精度高、速度快的交通目标检测效果。
-
公开(公告)号:CN117523184A
公开(公告)日:2024-02-06
申请号:CN202310932178.9
申请日:2023-07-27
Applicant: 南昌大学
IPC: G06V10/26 , G06V10/80 , G06V10/766 , G06V10/42 , G16H30/00 , G16H50/20 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种多级语义丰富神经网络的医学图像分割方法,将医学图像分层采用PCT模块得到低分辨率特征图Ⅰ;再将低分辨率特征图Ⅰ通过PCT模块得到低分辨率特征图Ⅱ;再将低分辨率特征图Ⅱ通过PCT模块得到低分辨率特征图Ⅲ;最后将低分辨率特征图Ⅲ通过PCT模块得到低分辨率特征图Ⅳ;将特征图Ⅳ通过上采样2倍后,与ES模块处理后的特征图Ⅲ进行拼接;再进行上采样2倍后与ES模块处理后的特征图Ⅱ进行拼接;最后进行上采样2倍后与ES模块处理后的特征图Ⅰ进行拼接,最终得到相应的特征图;将得到的最终特征图进行上采样4倍后,通过1×1的卷积调节通道数后得到最终的分割图。本发明能够对医学图像进行有效的分割,提高了医生对患者病情诊断的准确度。
-
公开(公告)号:CN117132809A
公开(公告)日:2023-11-28
申请号:CN202311017326.0
申请日:2023-08-14
Applicant: 南昌大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06F9/54 , G06N3/084 , G06N3/0895 , G06N3/0464
Abstract: 本发明提供了一种基于类原型匹配软伪标签的半监督医学图像分类方法,使用类原型匹配模块(CPM)预测未标记数据的软伪标签,该模块根据未标记数据局部邻域内标记数据的类原型相似度来自适应地预测其对应的软伪标签;设计了一个动态且无偏更新的缓存队列来存储预测正确的标记数据的标签和嵌入,并将缓存队列中属于同一类别的多个标记数据嵌入的均值作为该类的原型,使得类原型更加接近于真实特征中心;使用mixup增强方法来混合标记数据和未标记数据及其对应的标签,以增强模型学习类内和类间特征的能力,并在未标记数据两种不同类型的增强之间添加了一个额外的正则化项,以提高模型的预测能力。本发明有效地结合了伪标签和一致性正则化方法。
-
公开(公告)号:CN117061678A
公开(公告)日:2023-11-14
申请号:CN202311024599.8
申请日:2023-08-15
Applicant: 南昌大学
IPC: H04N1/32
Abstract: 本发明公开了基于抗SRM隐写分析的空域图像隐写方法,涉及密码学信息隐藏技术领域,所述隐写方法包括以下步骤:对隐写图像的修改像素进行残差预测及矫正,缩小覆盖图像和隐写图像间伪影;构造的高维预测滤波器,以多维度的抑制图像内容预测图像残差,基于空域富模型隐写分析提供空域图像残差的特征集;根据隐写方案使用的双层校验格码嵌入编码规则,选隐写像素修改方式,提取残差矫正后密文信息。本发明可以在较小的时间成本内,很好的减少数据隐藏留下的伪影,减小隐写图像与原图的残差距离,提高隐写图像抗SRM攻击的能力,具有很高的安全性。
-
公开(公告)号:CN117058452A
公开(公告)日:2023-11-14
申请号:CN202311021750.2
申请日:2023-08-15
Applicant: 南昌大学
IPC: G06V10/764 , G06V10/774 , G06V10/40 , G06V10/20 , G06V10/74
Abstract: 本发明提供了一种基于特征分布拟合和深度学习的小样本图像分类方法,该方法综合方向驱动策略和相似性权重策略,提出一种全新的基于特征分布拟合机制的小样本图像分类网络。其中,方向驱动策略可以在更多方向(维度)上描述和获取更完整的特征分布的信息;相似性权重策略可以估计不同的类别在特征分布拟合过程中产生的不同程度的影响,并为其分配相应的权重。该方法可以近似估计出小样本类的真实特征分布,并以此生成无数量限制的训练样本,以避免模型过拟合。
-
公开(公告)号:CN115909377A
公开(公告)日:2023-04-04
申请号:CN202211392147.0
申请日:2022-11-08
Applicant: 南昌大学
IPC: G06V30/41 , G06V30/14 , G06V30/148 , G06V30/162 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种基于轻量化空洞网络的高效率文档版面分析方法,包括两个阶段:分割阶段和分类阶段;步骤A:在分割阶段,通过Otsu算法和RLSA将一个文档页面分割成多个内容块;步骤B:在分类阶段,提出一种轻量级扩张网络LD‑Net,LD‑Net将所有区块分类为图像、表格、文本和公式;每个单独的块及其分类标签在OCR系统的下一个过程中被处理。本发明提出了一种用LD‑Net进行布局分析的内存效率方法,当在低内存设备上使用时,它在精度和内存占用方面优于现有方法;LD‑Net是根据深度可分离卷积和剩余连接设计的,这两种结构使得网络高效且轻巧;扩张卷积在LD‑Net中被采用,它可以节省空间信息,这对提高所提方法的准确性很重要。
-
-
-
-
-
-
-
-
-