-
公开(公告)号:CN117911789A
公开(公告)日:2024-04-19
申请号:CN202410218220.5
申请日:2024-02-28
申请人: 西北工业大学 , 西北工业大学深圳研究院
IPC分类号: G06V10/764 , G06V20/40 , G06V10/80 , G06N3/04 , G06N3/084
摘要: 本发明公开了一种面向视频的自进化目标识别方法,首先利用分类模型实时响应服务,然后再利用标注后的临时缓冲区对分类模型副本进行自进化学习,最后将自进化学习后的分类模型副本更新回原分类模型中。本发明自进化学习的模型具备更强大的分类性能,同时该自进化学习的方法具备更高效的学习效率。
-
公开(公告)号:CN117058009A
公开(公告)日:2023-11-14
申请号:CN202310740976.1
申请日:2023-06-21
申请人: 西北工业大学深圳研究院 , 西北工业大学
IPC分类号: G06T5/00 , G06V10/774 , G06V10/82 , G06V10/84 , G06N3/0464 , G06N3/048 , G06N3/08
摘要: 本发明公开了一种基于条件扩散模型的全色锐化方法,该模型包括正向加噪过程和反向去噪过程,算法的正向加噪过程通过马尔科夫链过程逐步将训练数据加噪为高斯噪声,反向去噪过程从高斯噪声出发,通过噪声预测网络的输出,逐步去噪采样得到高分辨率的多光谱图像;本方法使用细节信息(全色图像与上采样多光谱图像的差)作为条件,引导逆向去噪过程的从高斯噪声生成全色图像和多光谱图像的融合结果。训练好的噪声预测网络通过反向马尔科夫链过程进行多轮去噪迭代,生成最终的融合结果。本发明得到的融合结果空间和光谱信息保真度高,显著提高了噪声预测的精度。
-
公开(公告)号:CN114612506B
公开(公告)日:2024-03-15
申请号:CN202210169489.X
申请日:2022-02-19
申请人: 西北工业大学
摘要: 本发明公开了一种简易高效抗干扰的高空抛物轨迹识别与定位方法,首先将输入视频转化为图像帧,用ViBe检测算法对图像帧进行背景建模,同时实现前景检测,得到二值图;接下来使用形态学滤波得到候选目标检测框;然后,采用dHash算法计算相似度,在候选目标检测框中筛选出目标检测框;之后对目标检测框使用Sort算法进行多目标轨迹跟踪,获得目标的轨迹集合;再对目标轨迹集合,进行轨迹坐标差分,采用卷积神经网络进行分类,得到抛物轨迹坐标集合;最后将初始帧图像中目标检测框的中心位置作为本次高空抛物行为抛物起始点的定位位置。本发明方法提高了高空抛物行为识别的准确率,并且极大的减少了误检噪声对高空抛物跟踪的影响。
-
公开(公告)号:CN111783979B
公开(公告)日:2024-01-12
申请号:CN202010575574.7
申请日:2020-06-22
申请人: 西北工业大学
摘要: 本发明提供了一种基于SSIM算法的图像相似度检测硬件加速器VLSI结构,包括输入模块、乘法单元模块、加法器阵列、累加移位器模块、算数运算模块和累加计算器。输入模块用高斯模板对待比较图像进行扫描,将图像像素亮度值存储在当前帧图像行存和参考帧图像行存;乘法单元模块、加法器阵列、累加移位器模块、算数运算模块和累加计算器按照SSIM算法对两个行存的数据分别进行一系列处理,最终得到两幅待比较图像的MSSIM值,通过对MSSIM值进行比较,判断两幅图像是否相似。基于此架构可设计图像相似度检测硬件加速器,用来比较两幅图像的相似度。该VLSI结构可以提高嵌入式视觉和图像处理系统的性能,对系统功耗有严格限制的端侧嵌入式视觉系统具有重要的应用价值。
-
公开(公告)号:CN118279701B
公开(公告)日:2024-10-18
申请号:CN202410692426.1
申请日:2024-05-31
申请人: 西北工业大学
IPC分类号: G06V10/774 , G06N3/0455 , G06N3/0464 , G06N3/084 , G06V10/82
摘要: 本发明公开了模型和样本存储资源联合优化的持续进化学习方法与系统,涉及图像持续识别技术领域,包括如下步骤:采集若干连续图像构建样本数据集;对模型可学习参数的更新;对模型可学习参数的掩码梯度的更新;样本学习权重的更新并保存样本。本发明经过可学习参数微调快速将模型适应于下游任务,通过可学习参数掩码的更新动态调整模型参数,通过样本权重的更新动态调整各个样本对模型的贡献度,用双层优化将这三部分的更新统领在一起,使得各个部分的更新更加合理,同时实现了动态平衡模型内存空间和保存样本所需的内存空间,打破以往单一考虑模型内存空间优化或样本内存空间优化的局限,能更进一步提高内存空间的利用率。
-
公开(公告)号:CN118505561A
公开(公告)日:2024-08-16
申请号:CN202410542941.1
申请日:2024-05-01
申请人: 西北工业大学
摘要: 本发明公开了一种基于文本调制扩散模型的强泛化全色锐化方法,利用文本提示卫星数据相关的信息,调制扩散模型的参数,并使用3D卷积神经网络构建模型。该模型由正向扩散过程和反向去噪过程组成,其中正向扩散过程通过马尔科夫链方式逐步给目标图像添加高斯噪声,反向去噪过程从标准高斯分布的噪声数据逐步生成目标高分辨率多光谱图像。本发明设计了一个文本调制的3D卷积神经网络,文本提示通过CLIP的文本编码器生成文本编码,与3D卷积神经网络的卷积核在通道维度相乘,为不同的卫星数据生成适配的网络参数,处理多个卫星数据集。本发明能够利用多个遥感数据集,从而在增强空间细节信息的同时减少光谱失真,并极大增强了模型在未知数据集的泛化能力。
-
公开(公告)号:CN114841312B
公开(公告)日:2024-02-27
申请号:CN202210326905.2
申请日:2022-03-30
申请人: 西北工业大学
IPC分类号: G06V10/82 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/0895 , G06V10/774 , G06V10/764 , G06V20/40 , G06V20/52
摘要: 本发明公开了一种基于自适应图卷积网络的弱监督视频异常检测方法,提出一个基于弱监督的自适应图卷积网络(WAGCN)来建模视频片段之间的上下文关系,而且在生成每个片段的异常概率时,充分考虑了其他视频片段对当前片段的影响。首先结合视频特征具有的时间连续性以及空间上的相似性进行构图,充分利用了视频中异常事件时空特征间存在的关联信息。其次,提出了一个图学习层,打破人为设定拓扑结构的局限性,它基于数据自适应地提取稀疏图邻接矩阵。在两个公共数据集上进行了大量的实验证明了方法的有效性。
-
公开(公告)号:CN116524183A
公开(公告)日:2023-08-01
申请号:CN202310401697.2
申请日:2023-04-16
申请人: 西北工业大学
IPC分类号: G06V10/26 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/09 , G06N3/096
摘要: 本发明涉及一种基于多任务适配器微调的伪装目标检测方法,提出了一种了“预训练、适应和检测”框架来检测伪装物体,通过在各种任务上学习更加广泛的知识,使其面对伪装物体的欺骗更加“智能”。具体而言,首先利用大规模的多模态数据对基础模型进行预训练,然后并行插入一个轻量级适配器,使预先训练好的模型适应于下游任务。在获得更精细的特征图后,使用COD检测头精确检测像素级伪装目标。本发明进一步提供了跨任务学习适配器的多任务学习方案,通过对源任务的多任务适配器初始化和对目标任务的多任务适配器自适应,可以学习不同语义类别间的共享知识,从而提高模型的泛化能力。
-
公开(公告)号:CN110909605A
公开(公告)日:2020-03-24
申请号:CN201911015544.4
申请日:2019-10-24
申请人: 西北工业大学
摘要: 本发明涉及一种基于对比相关的跨模态行人重识别方法,主要包括两部分:保持空间信息的双路网络和对比相关网络。保持空间信息的双路网络用来提取两个模态共有的与模态无关的,并且保持空间信息的特征,在此基础上,对比相关网络被设计用来关注两个行人间的语义差异,从而判断两个行人是否属于同一行人。本发明提高了跨模态的行人重识别任务的精度。
-
公开(公告)号:CN118379484B
公开(公告)日:2024-10-18
申请号:CN202410788932.0
申请日:2024-06-19
申请人: 西北工业大学
IPC分类号: G06V10/25 , G06N3/0455 , G06N3/0464 , G06N3/082 , G06V10/44 , G06V10/77 , G06V10/774 , G06V10/82
摘要: 本发明提供了一种基于频率指导空间自适应的伪装目标检测方法,通过设计适配器从频域的角度提取和增强细节信息,使模型更加准确地捕捉伪装目标的精细特征。首先是频率引导的空间注意力模块,该模块通过动态调整频率分量使注意力更多地集中于伪装目标。在第一个模块的基础上又设计得到另外两个模块,即基于频率的细微差异挖掘模块和基于频率的特征增强模块,两者共同构成适配器,负责细微特征的提取和增强。本发明结合了来自视觉基础模型的通用知识和从下游COD任务中学到的特定任务知识,通过在频域空间自适应调整频率分量,来引导预训练基础模型在空间域更多地关注到伪装目标,在四个广泛采用的COD基准数据集上实现了最先进的性能。
-
-
-
-
-
-
-
-
-