-
公开(公告)号:CN117152821A
公开(公告)日:2023-12-01
申请号:CN202311142081.4
申请日:2023-09-05
Applicant: 南京理工大学
IPC: G06V40/16 , G06V10/778 , G06V10/774
Abstract: 本发明公开了一种基于双重对比学习的跨域人脸面部运动单元检测方法,属于面部识别技术领域,包括数据准备阶段、端到端模型设计阶段、端到端模型训练阶段和端到端模型测试阶段;所述数据准备阶段中使用源场景的AU数据集及AU标注和无标注的目标场景数据集;所述端到端模型设计阶段包括预准备、搭建模型架构和设计损失函数。本发明提供的一种基于双重对比学习的跨域人脸面部运动单元检测方法,通过多种约束不仅能生成清晰的图片以可视化解耦效果,也可以增强模型的解耦效果,提升跨域AU检测的性能。
-
公开(公告)号:CN117152527A
公开(公告)日:2023-12-01
申请号:CN202311164907.7
申请日:2023-09-08
Applicant: 南京理工大学
IPC: G06V10/764 , G06V10/766 , G06V10/774 , G06V10/82 , G06V10/84 , G06V10/74 , G06N5/02
Abstract: 本发明公开了一种基于图组合优化的稀疏标记遥感图像目标检测方法,属于遥感图像目标检测的技术领域;构建稀疏标记的遥感图像数据集,并利用有限的标记数据对旋转目标检测器进行预训练。在训练阶段使用学生网络推理预测集,教师网络生成候选伪标签集,并构造全局对象图,基于适当的目标函数用图神经网络去参数化一个概率分布,映射为一个期望的解,根据蒙特卡洛采样和马尔可夫不等式最小化目标函数,从而优化图神经网络,得到最优的伪标签子集,最后利用增加的监督信号不断地更新和优化检测器。本发明采用上述方法,基于图神经网络的组合优化选出最优伪标签子集可以有效地利用有限的标签数据,从而提高稀疏标记遥感图像目标检测的性能。
-
公开(公告)号:CN116108375A
公开(公告)日:2023-05-12
申请号:CN202211630011.9
申请日:2022-12-19
Applicant: 南京理工大学
IPC: G06F18/241 , G06F18/28 , G06F30/27 , G06N3/0464 , G06N3/08 , G06N5/04
Abstract: 本发明公开了一种基于结构敏感图字典嵌入的图分类方法,包括以下步骤:构造基础图字典‑分别用于对输入图和字典键进行建模,在此过程中,图卷积神经网络学习每个节点的嵌入表示‑将得到的嵌入表示输入到变分图字典自适应模块,学习出自适应图字典,生成更具表达能力的字典‑度量交叉图节点之间的相关性,并实现交叉图的嵌入‑对得到的嵌入表示通过全连接层获得更低维的嵌入表示,从而得到分类结果,并引入互信息作为目标,推导出自适应图字典的变分推理,使得能够端到端的进行训练和优化。本发明采用上述基于结构敏感图字典嵌入的图分类方法,增强了原始图字典的表达能力,提高了结构变化的灵敏度,从而为重要的局部相关模式,准确地表示输入图。
-
公开(公告)号:CN112488117B
公开(公告)日:2022-09-27
申请号:CN202011436923.3
申请日:2020-12-11
Applicant: 南京理工大学
IPC: G06V10/26 , G06V10/764 , G06V10/40 , G06V10/82 , G06N3/04
Abstract: 本发明公开了一种基于方向诱导卷积的点云分析方法,包括构建方向诱导卷积模块,所述方向诱导卷积模块用于提取点云无序邻域的特征;基于方向诱导卷积模块,构建残差方向诱导卷积模块和最远点采样残差方向诱导卷积模块;根据残差方向诱导卷积模块和最远点采样残差方向诱导卷积模块构建方向诱导卷积网络;将点云数据输入方向诱导卷积网络,获得点云分割结果和分类结果。本发明以一种端到端的方式更好的捕获了点云的局部空间结构,提高了点云分类以及点云分割的准确率。
-
公开(公告)号:CN115049815A
公开(公告)日:2022-09-13
申请号:CN202210498288.4
申请日:2022-05-09
Applicant: 南京理工大学
Abstract: 一种基于自注意力蒸馏和图像增强的水下目标检测方法及系统,该方法包括步骤:构造目标检测模型,基于Yolov5网络,嵌入基于暗通道先验的水下图像增强模块;同时将自注意力蒸馏引入网络Yolov5,获取从后层到前层的反馈连接路径;对目标检测模型训练,获取满足精度要求的最优目标检测模型训练;采集图像输入至最优目标检测模型训练,进行水下水下目标检测。本发明提升水下目标检测网络的泛化性和鲁棒性,并解决现有水下目标检测网络提取的特征表征不够鲁棒,模型识别精度低等问题。
-
公开(公告)号:CN112053327B
公开(公告)日:2022-08-23
申请号:CN202010832866.4
申请日:2020-08-18
Applicant: 南京理工大学 , 腾讯科技(深圳)有限公司
Abstract: 本发明实施例公开了视频目标物检测方法、系统及存储介质和服务器,应用于人工智能的信息处理技术领域。视频目标物检测系统会将待检测视频中多个连续帧图像的特征都融合到其中某一帧图像的特征中,形成首次融合特征,然后将首次融合特征中的多层采样特征再融合形成二次融合特征,最后根据二次融合特征对某一帧图像中的目标物进行检测。由于在两次融合特征获取过程中,不仅考虑了待检测视频中各帧图像本身的信息,还考虑了与相邻帧图像之间的序列信息,进一步地考虑了多层采样特征,使得最终获取的二次融合特征能准确地描述待检测图像中某一帧图像的特征,进而使得根据二次融合特征进行目标物检测的结果也比较准确。
-
公开(公告)号:CN119580146A
公开(公告)日:2025-03-07
申请号:CN202411616282.8
申请日:2024-11-13
Applicant: 南京理工大学
IPC: G06V20/40 , G06V10/44 , G06V10/764 , G06V10/80 , G06V10/82 , G06F40/30 , G06N3/0455 , G06N3/0475 , G06N5/045
Abstract: 本发明公开了基于扩散模型和文本嵌入的视频异常检测方法,涉及视频异常检测技术领域。本发明提供的基于扩散模型和文本嵌入的视频异常检测方法,包括首先利用图文生成模型提取各视频帧的文本信息,再通过预训练的CLIP文本编码器得到语义特征;基于图像扩散模型和文本扩散模型,构建视频异常检测模型,并利用交叉注意力机制分别引导图像扩散去噪网络、文本扩散去噪网络重构图像特征和文本特征,再通过整体优化完成模型训练,进而对视频异常进行检测。因此,采用上述方法,能够借助扩散模型的强大生成能力和图生文模型的语义理解能力,缓解了特定场景下的过度泛化问题,增强了视频异常检测的可解释性,提高视频异常检测模型的性能。
-
公开(公告)号:CN119445176A
公开(公告)日:2025-02-14
申请号:CN202411581715.0
申请日:2024-11-07
Applicant: 南京理工大学
IPC: G06V10/762 , G06V10/764 , G06V10/774 , G06V10/25 , G06V10/40 , G06V10/80 , G06F18/213 , G06V10/776 , G06N3/0455 , G06N3/047 , G06N3/084
Abstract: 本发明公开了一种基于双流特征融合的三维点云开放场景理解方法,属于多模态学习领域,包括数据准备,收集三维点云数据V,进行数据标注得到三维点云开放场景理解数据集A,将获得的三维点云开放场景理解数据集A进行数据集划分;构建三维点云开放场景监督信息,构建前景兴趣区和构建开放语义信息,融合双流特征信息;设计包含一个三维点云特征提取器E、预训练的文本特征提取器θtext与多模态判别器D的模型M;训练模型M得到模型M*;在模型M*上进行测试;本发明采用上述一种基于双流特征融合的三维点云开放场景理解方法,实现了在开集上的三维点云场景理解,显著提高了开集语义分割等任务的精度。
-
公开(公告)号:CN115049815B
公开(公告)日:2024-08-23
申请号:CN202210498288.4
申请日:2022-05-09
Applicant: 南京理工大学
IPC: G06V10/20 , G06V10/774 , G06V10/82 , G06V20/05 , G06N3/0464 , G06N3/082 , G06N3/0495
Abstract: 一种基于自注意力蒸馏和图像增强的水下目标检测方法及系统,该方法包括步骤:构造目标检测模型,基于Yolov5网络,嵌入基于暗通道先验的水下图像增强模块;同时将自注意力蒸馏引入网络Yolov5,获取从后层到前层的反馈连接路径;对目标检测模型训练,获取满足精度要求的最优目标检测模型训练;采集图像输入至最优目标检测模型训练,进行水下水下目标检测。本发明提升水下目标检测网络的泛化性和鲁棒性,并解决现有水下目标检测网络提取的特征表征不够鲁棒,模型识别精度低等问题。
-
公开(公告)号:CN114900033B
公开(公告)日:2023-02-14
申请号:CN202210443343.X
申请日:2022-04-26
Applicant: 南京理工大学
Abstract: 本发明提出了一种基于深度学习的变流器输出频谱定制方法,通过采集不同随机开关频率时序下变流器的输出频谱向量,构建开关频率时序向量—输出频谱向量之间的映射模型;为实现变换器输出频谱可塑性,建立机器学习模型,通过对大量的输出频谱—开关频率样本的深度学习训练得到机器学习模型参数,确定二者之间的高维非线性函数关系,进而实时根据目标输出频谱向量“逆向”求解对应的开关频率时序向量。本发明可实时地根据所需输出频谱,“逆向”求解变换器的开关频率时序向量,进而实现输出频谱的灵活精确调节。
-
-
-
-
-
-
-
-
-