一种基于半监督极限学习机的多类图像分类方法

    公开(公告)号:CN104992184A

    公开(公告)日:2015-10-21

    申请号:CN201510381792.6

    申请日:2015-07-02

    Applicant: 东南大学

    CPC classification number: G06K9/627 G06K9/6256

    Abstract: 本发明公开了一种基于半监督极限学习机的多类图像分类方法,将训练样本集分为已标注样本集L、未标注样本集U和测试集T;把U中的样本进行有放回重采样构建N个差异的训练子集;然后在各个子集上与已标记训练样本L分别训练一个半监督极限学习机模型,共N个分类器;将这N次极限学习机对应节点的输出求和取平均;将输出作归一化处理后,应用最优标记和次优标记算法BvSB的主动学习技术对样本进行不确定性评估,从U中取最不确定的样本进行人工标注并转移到L中;重新更新分类器模型,直至迭代结束。通过本发明,解决了相关技术中图像分类存在分类正确率低和学习速度低的问题,为准确、快速、稳定的图像分类奠定了一定的基础。

    一种基于Transformer的高性能目标跟踪方法

    公开(公告)号:CN118982561A

    公开(公告)日:2024-11-19

    申请号:CN202411118063.7

    申请日:2024-08-15

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于Transformer的高性能目标跟踪方法,旨在优化边缘计算设备上的跟踪应用。包含以下步骤:步骤1,获取图像并裁剪,从视频流中提取图像帧,裁剪得到模板图像和搜索区域图像;步骤2,构建一个模板分支可分离的层级式Transformer网络架构;步骤3,模板图像编码,将模板图像输入模板分支的Transformer编码器,并缓存其深度特征;步骤4,搜索区域图像编码,将缓存的模板特征和搜索图像输入搜索区域分支的Transformer编码器,得到多尺度特征注意力图;步骤5,自适应融合多尺度特征,将融合后的特征送入Head网络中,确定目标位置。通过上述步骤,本发明提出的方法利用Transformer网络的强大特征提取和注意力机制,实现了高性能的目标跟踪,适用于计算资源受限的边缘计算设备。

    一种基于几何条件限制的三维车辆检测方法

    公开(公告)号:CN110427797B

    公开(公告)日:2023-09-15

    申请号:CN201910452418.9

    申请日:2019-05-28

    Applicant: 东南大学

    Inventor: 杨万扣 张弦 王超

    Abstract: 本发明公开一种基于几何条件限制的三维车辆检测方法,包括训练和识别阶段;训练阶段的方法为,给定彩色输入图像,首先进行预选框生成,获得可能存在的初始区域,减少搜索范围,然后对每个预选框位置进行特征提取,最终送入不同的分支网络中;测试阶段的方法为,首先利用训练好Region Proposal Network在不同尺度的特征层上生成不同尺度和形状的预选框,然后对预选框对应特征进行RoI‑Pooling,得到对应的三维属性,最终利用透视投影变换公式约束得到完整的车辆三维信息。本发明对图像的噪声具有较强的鲁棒性,可增加车辆检测的鲁棒性,提高三维车辆识别的识别率,大大减少识别所需时间,具有十分重要的实用价值。

    一种基于角度参数化的航向初始对准方法

    公开(公告)号:CN114877891A

    公开(公告)日:2022-08-09

    申请号:CN202210679941.7

    申请日:2022-06-16

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于角度参数化的航向初始对准方法。首先,基于计算量较低的要求,推导基于六轴惯性传感器的Mahony姿态解算算法,对产生数据进行提取预处理。其次,结合扩展卡尔曼滤波与高斯和滤波器,研究基于角度参数化的航向初始对准技术。通过角度参数化的方法,将初始航向角分割为等间隔方向,将解算的航向角输入到相应的角度参数化滤波算法模块,进行低精度组合导航系统的航向初始对准。在初始航向角存在大失准角的情况下,该系统可以通过短时间的机动,航向角完成初始对准,最终实现强鲁棒性、高精度的组合导航航向角初始化。

    一种基于双子网络的红外弱小目标检测方法

    公开(公告)号:CN113449813A

    公开(公告)日:2021-09-28

    申请号:CN202110816221.6

    申请日:2021-07-20

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于双子网络的红外弱小目标检测方法,包括如下步骤:步骤1,分别构建包含两个子网络的主体框架;步骤2,对训练图像进行数据预处理送入网络;步骤3,针对子网络1,计算漏检抑制损失函数,并更新参数;针对子网络2,计算虚警抑制损失函数,并更新参数;步骤4,转至步骤2,直至训练收敛,保存两个子网络;步骤5,在测试阶段,把图像分别输入两个子网络,得到两组结果;步骤6,将两组检测结果融合,输出最终结果。本申请针对红外弱小目标图像特点,设计了一种基于双子网络的红外弱小目标检测方法,使用两个子网络分别针对红外弱小目标检测的虚警率和漏检率的任务,进一步提高红外弱小目标检测精度和鲁棒性。

    一种基于不平衡Fisher判别分析的尿沉渣检测方法

    公开(公告)号:CN110599462A

    公开(公告)日:2019-12-20

    申请号:CN201910782936.7

    申请日:2019-08-23

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于不平衡局部Fisher判别分析的尿沉渣检测方法。首先,对输入尿沉渣有形成分图像提取聚合通道特征。其次,对每个通道使用Haar-like模板进行通道滤波提取中间层特征。接着,对单个通道的特征进行分组,随机选择若干组的特征进行线性加权组合成一个新的候选特征。然后,考虑到样本分布的不平衡性,提出一种不平衡局部Fisher判别分析方法来进行加权系数的学习。最后,将所有通道的候选特征串联起来形成最后的特征向量,结合基于决策树的Adaboost分类器进行训练,针对不同的尿沉渣有形成分训练不同的检测器。本发明考虑了尿沉渣有形图像的局部信息融合和样本分布的不平衡性,有效的降低了噪声的影响,准确率高,计算速度快,具有十分重要的实用价值。

    一种基于级联卷积神经网络结构的人脸检测方法

    公开(公告)号:CN109145854A

    公开(公告)日:2019-01-04

    申请号:CN201811015651.2

    申请日:2018-08-31

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于级联卷积神经网络的人脸检测方法,涉及模式识别、机器学习、图像处理等技术领域,该方法分为三个阶段,第一个阶段:将低分辨率的候选窗口输入浅层卷积神经网络用于快速筛选大量背景窗口;第二个阶段:将通过第一阶段的候选窗口,调整成不同尺度的图像金字塔;第三个阶段:将图像金字塔中对应分辨率的图像分别输入网络的两个分支,用于最终人脸分类和边界框回归。训练过程中,针对困难样本在线训练,采用软‑非极大值抑制算法对数据集进行多尺度测试,在PASCAL FACE和FDDB两个公开数据集上与其他方法进行结果对比,验证了方法的有效性。

    一种少样本二维人体姿态估计方法

    公开(公告)号:CN119919964A

    公开(公告)日:2025-05-02

    申请号:CN202411936623.X

    申请日:2024-12-26

    Applicant: 东南大学

    Inventor: 杨万扣 张浩然

    Abstract: 本发明公开了一种在少样本情形下利用深度学习进行二维人体姿态估计的有效方法,该方法包含如下步骤:(1)对于有标注样本,采用通用的监督学习方式训练姿态估计模型;(2)对于无标注样本,采用“一致性训练”或“多教师”方法得到其伪标签,并利用额外的不确定度分支分别估计伪标签的先验和后验不确定度信息;(3)在无标注样本的训练损失项中引入不确定度估计结果:将先验不确定度作为损失项整体权重引入,将后验不确定度作为损失平衡因子引,完成无标注样本部分的训练;(4)对于采用“多教师”方法训练的模型,将伪标签的不确定度估计结果引入融合过程,实现更高质量的伪标签融合。本发明提出的方法能够在引入尽可能少的模型参数量的情况下,有效提取无标签样本中的不确定度信息,引导模型更好地进行从无标签样本的伪标签中进行学习,在少量标注样本的情形下实现高质量的二维人体姿态估计性能。

    一种多视角全身人体图像生成方法

    公开(公告)号:CN116597026A

    公开(公告)日:2023-08-15

    申请号:CN202310601275.X

    申请日:2023-05-25

    Applicant: 东南大学

    Abstract: 本发明公开了一种多视角全身人体图像生成方法,包括如下步骤:步骤1,构建人体图像生成器及判别器的主体框架;步骤2,输入一批潜在编码、人体关节点热图及相机参数,由生成器生成一批图像;步骤3,将生成的图像送入判别器,计算损失函数,以更新生成器网络参数;步骤4,将数据集中一批图像送入判别器,计算损失函数,以更新判别器网络参数,完成一次网络训练;步骤6,重复步骤2到步骤5,直至训练收敛,得到最终的全身人体图像生成器;步骤7,在测试阶段,把潜在编码、人体关节点热图及相机参数输入生成器,得到生成的图像。本申请解决了全身人体图像生成速度慢、质量低、不真实的问题,且本申请可控制生成图像的人体姿态、相机视角。

    一种基于类Haar中间层滤波特征的行人检测方法及装置

    公开(公告)号:CN105760858A

    公开(公告)日:2016-07-13

    申请号:CN201610160605.6

    申请日:2016-03-21

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于类Haar中间层滤波特征的行人检测方法。首先提取训练图像集中各训练图像的目标特征,并用所提取的目标特征数据对基于决策树的Adaboost分类器进行训练,得到分类模型;然后提取待检测图像在多个尺度下的目标特征并输入所述分类模型,得到行人检测结果;目标特征的提取方法具体如下:对原始图像分别提取多个不同的通道特征,得到该原始图像的多幅通道特征图;对各通道特征图分别进行降采样;对每一幅降采样后的通道特征图,利用一组预设的类Haar特征模板分别提取该通道特征图的相应类Haar特征;将该原始图像的所有类Haar特征聚合为该原始图像的目标特征。本发明还公开了一种基于类Haar中间层滤波特征的行人检测。本发明可有效提高行人检测性能。

Patent Agency Ranking