-
公开(公告)号:CN116244473A
公开(公告)日:2023-06-09
申请号:CN202310096857.7
申请日:2023-02-10
Applicant: 南京理工大学
IPC: G06F16/783 , G06F16/75 , G06V10/44 , G06V10/764 , G06V10/82 , G06F18/241 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于特征解耦和图知识蒸馏的多模态情感识别方法,包括以下步骤:S1、数据收集;S2、端到端的模型设计;S3、模型训练;S4、输入数据为类似步骤S1处理得到的多模态情感识别测试集I。测试阶段使用的模型为模型M中的浅层特征提取器E,共享编码器私有编码器多模态Transformer和情感分类器C,将测试集I输入步骤S3获得的模型M*中以得到测试集I的情感识别结果。本发明采用上述的一种基于特征解耦和图知识蒸馏的多模态情感识别方法,实现了端到端的多模态情感识别,显著提升了多模态情感识别的精度。
-
公开(公告)号:CN115242112B
公开(公告)日:2023-04-21
申请号:CN202210885407.1
申请日:2022-07-26
Applicant: 南京理工大学
Abstract: 本发明提出了一种基于路径规划的并联型多电平变换器开关时序统一构造方法,将多台变流器并联系统视作一个整体,建立了多台变流器并联的矢量平面;其次,根据矢量间切换需满足总开关次数、对称性、矢量切换次数和时序段数之间的强约束关系,本发明将矢量时序构造研究转化为多点之间的路径规划问题研究;最后,最终路径优化目标由工业现场具体生产工况和工艺要求决定,不同工艺和工况要求的优化目标顺序不同。本发明将路径规划思路引入脉宽调制领域,根据优化需求选择不同路径,形成以目标优化为导向的开关时序统一构造方法,适用于多并联变流器调制领域。
-
公开(公告)号:CN115908987A
公开(公告)日:2023-04-04
申请号:CN202310057815.2
申请日:2023-01-17
Applicant: 南京理工大学
IPC: G06V10/774 , G06V10/82 , G06N3/084 , G06V10/764 , G06N3/0464 , G06N3/045
Abstract: 本发明公开了一种基于分层自动关联学习的目标检测方法,该方法包括以下步骤:在层次结构的基础上引入关联学习模块;建立基于能量驱动的概率模型;通过最大化对数似然对模型进行优化;通过关联学习模块的反向传播梯度生成对应对象的热图。本发明定义了一个针对目标主动检测的分层自动关联模型,该模型旨在以一种无监督的方式捕捉对象的分布,直接从单类搜素图像中学习,无需任何预处理操作符,大大减少了人力成本;在实践中,只需说出物体的名称,模型就可以主动从互联网上学习,对比现有的学习模型更加智能。
-
公开(公告)号:CN115294347A
公开(公告)日:2022-11-04
申请号:CN202210625740.9
申请日:2022-06-02
Applicant: 南京理工大学
Abstract: 本发明公开了一种基于弦振动理论的目标轮廓提取方法,通过卷积神经网络提取得到图像的特征轮廓,并通过编码‑解码的结构输出对系数预测的系数预测图,;对特征轮廓的初始化位置进行设置;根据当前时刻的轮廓位置从系数预测图,上索引对应的系数,构建用于演化的系数矩阵、系数向量;依据弦振动理论建立的轮廓振动模型,代入已有时刻的轮廓位置和系数矩阵、系数向量,得到更新后的目标轮廓。本发明能够有效地检测出目标轮廓,相比于经典的动态轮廓方法避开了能量项的设计,建立关于轮廓运动的模型,提高了目标形状提取的精确度。
-
公开(公告)号:CN112053327A
公开(公告)日:2020-12-08
申请号:CN202010832866.4
申请日:2020-08-18
Applicant: 南京理工大学 , 腾讯科技(深圳)有限公司
Abstract: 本发明实施例公开了视频目标物检测方法、系统及存储介质和服务器,应用于人工智能的信息处理技术领域。视频目标物检测系统会将待检测视频中多个连续帧图像的特征都融合到其中某一帧图像的特征中,形成首次融合特征,然后将首次融合特征中的多层采样特征再融合形成二次融合特征,最后根据二次融合特征对某一帧图像中的目标物进行检测。由于在两次融合特征获取过程中,不仅考虑了待检测视频中各帧图像本身的信息,还考虑了与相邻帧图像之间的序列信息,进一步地考虑了某些重点的特征(即多层采样特征),使得最终获取的二次融合特征能准确地描述待检测图像中某一帧图像的特征,进而使得根据二次融合特征进行目标物检测的结果也比较准确。
-
公开(公告)号:CN110633661A
公开(公告)日:2019-12-31
申请号:CN201910820020.6
申请日:2019-08-31
Applicant: 南京理工大学
Abstract: 本发明公开了一种融合语义分割的遥感图像目标检测方法,构建改进的特征金字塔网络,提取遥感图像的多层金字塔特征;对金字塔特征进行语义分割,获取目标边界框级别的掩码和语义特征;构建图片笛卡尔直角坐标系,根据提取的金字塔特征和生成的边界框级别的掩码生成与图片坐标轴平行的候选框;根据候选框坐标、多层金字塔特征、语义特征和归一化后的原始图像确定边界框特征,再进行回归和softmax操作得到与坐标轴平行/旋转的边界框的位置信息以及物体的类别信息。本发明提高了遥感图像小目标检测的准确率。
-
公开(公告)号:CN109359568A
公开(公告)日:2019-02-19
申请号:CN201811154729.9
申请日:2018-09-30
Applicant: 南京理工大学
Abstract: 本发明公开了一种基于图卷积网络的人体关键点检测方法,使用卷积神经网络从图像中提取人体特征,预测人体关键点响应图,确定初始关键点坐标;根据预测的关键点坐标,从卷积神经网络中提取对应人体各个关键点的局部特征;建立人体关键点的图模型,根据人体的每个关键点与邻近关键点的位置关系,提取每个关键点的特征向量;把人体各个关键点的特征向量输入图卷积网络,得到每个关键点的偏移,用初始关键点坐标加上偏移,即得优化的关键点预测结果。本发明所预测关键点相比于其他方法,对人体关键点建立图模型,更好地考虑了关键点之间的联系,提高了关键点预测的准确率。
-
公开(公告)号:CN119832026A
公开(公告)日:2025-04-15
申请号:CN202411939474.2
申请日:2024-12-26
Applicant: 南京理工大学
IPC: G06T7/246 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种应用于卫星视频多目标跟踪的三重注意力方法,涉及卫星视频多目标跟踪技术领域,将卫星视频帧序列输入三重注意力模块得到增强特征图;将增强特征图输入骨干网络得到特征图;将特征图分别输入检测头和跟踪头;利用损失函数更新优化网络。本发明采用上述一种应用于卫星视频多目标跟踪的三重注意力方法,用三重注意力机制,分别从空间、通道和时间三个维度增强当前帧特征,自适应重标定特征图中每个通道和空间位置重要性的同时通过相邻帧特征聚合融入了时间信息,从而提升模型的表征能力和决策准确性,可适用于卫星视频中的多目标跟踪问题。
-
公开(公告)号:CN118470558A
公开(公告)日:2024-08-09
申请号:CN202410619300.1
申请日:2024-05-19
Applicant: 南京理工大学
IPC: G06V20/13 , G06V10/25 , G06V10/764 , G06V10/82 , G06V10/762 , G06V10/774
Abstract: 本发明公开了一种基于旋转重复点描述的遥感小目标检测方法及系统,方法包括:利用旋转等变骨干网络和旋转等变金字塔网络提取旋转等变的特征;在初始阶段,基于目标中心点生成多个自适应点,通过特定转换函数将自适应点转换为伪框;在细化阶段,评估自适应点的质量,采用动态k标签分配方法,选择质量分数最高的前k个样本作为最终的正样本,通过最小化综合损失函数,得到最终检测结果。本发明在Oriented RepPoints算法的基础上定义了一种针对遥感图像目标的旋转重复点描述检测器,以自适应点表示的方式,捕捉遥感目标的旋转等变特性,并通过设置空间约束来增强模型对离群目标的惩罚能力。
-
公开(公告)号:CN117711636A
公开(公告)日:2024-03-15
申请号:CN202311727080.6
申请日:2023-12-15
Applicant: 南京理工大学
IPC: G16H50/80 , G16H50/50 , G06N3/0464
Abstract: 本发明公开了基于注意力机制的张量时空图卷积的猴痘疫情预测方法,属于人工智能领域和流行病学研究领域的交叉任务。具体而言,该方法首先将流行病网络建模为无向属性图(Graph),基于航班量和自适应学习共同构建节点的空间邻接关系,节点属性来自所代表国家的猴痘病例数。此外,节点的属性具备动态时序性,从而使整个网络可以被建模为时空图结构。本发明在高维张量空间中建模了时空图内部的时空关联,实现了对时空关联的统一建模。此外,本发明首次将航班信息融入时空图卷积网络,并利用注意力机制来学习额外的空间依赖性,在猴痘疫情病例预测任务中,该方法表现出了优异的性能。
-
-
-
-
-
-
-
-
-