-
公开(公告)号:CN118429870B
公开(公告)日:2024-11-12
申请号:CN202410897337.0
申请日:2024-07-05
申请人: 南京信息工程大学
IPC分类号: G06V20/40 , G06V20/52 , G06V10/42 , G06V10/44 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/042 , G06N3/0464 , G06N3/0499 , G06N3/08
摘要: 本发明公开了一种群体行为识别方法、系统和存储介质,包括:获取待识别的视频帧;根据视频帧,基于预训练好的群体行为识别模型,得到群体行为类别;所述群体行为识别模型包括:骨干网络、融合模块、嵌入层、关系推理模块、图卷积网络、全局平均池化层以及分类器。本发明通过模型中的融合模块将全局特征中包含的场景信息嵌入个体特征中,为个体动作与群体行为类别的推理提供了信息丰富的融合特征,最终提高了群体行为的识别精度。
-
公开(公告)号:CN118470014B
公开(公告)日:2024-09-24
申请号:CN202410925191.6
申请日:2024-07-11
申请人: 南京信息工程大学
IPC分类号: G06T7/00 , G06V10/25 , G06V10/44 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464
摘要: 本发明公开了一种工业异常检测方法及系统,包括:获取待异常检测的图像;根据获取的图像,基于预训练好的异常检测模型,对异常进行检测定位;所述异常检测模型包括:骨干网络、池化层、级联流、双子流以及恒定流;所述级联流包含若干依次排列的流块。本发明使得异常数据特征与正常数据特征之间有更加明显的区别,进而提升定位异常的效果。
-
公开(公告)号:CN113609906B
公开(公告)日:2024-06-21
申请号:CN202110736883.2
申请日:2021-06-30
申请人: 南京信息工程大学
IPC分类号: G06V30/413 , G06V30/19 , G06V10/82
摘要: 本发明涉及一种面向文献的表格信息抽取方法,属于数据处理以及计算机视觉领域。该方法包括以下步骤:1:利用规则获取所有可能含表格的候选页面;2:将获取的页面转化为图片文件;3:采用深度学习方法,获取图片文件的特征;4:根据获取的图片文件的特征,对图片进行特征融合;获取融合后的特征;5:根据获取的特征融合后的特征,对表格的位置进行初步定位;6:针对获得的表格定位信息,根据表格元素的长宽关系,将横板表格旋转为竖版表格;7:根据获得的竖版表格,读取单元格字符流。本发明能自动对表格位置进行准确的定位,能够精确的从表格中读取表格的字符流。
-
公开(公告)号:CN118037733A
公开(公告)日:2024-05-14
申请号:CN202410438275.7
申请日:2024-04-12
申请人: 南京信息工程大学
IPC分类号: G06T7/00 , G06T7/11 , G06T5/50 , G06N3/0464 , G06N3/09
摘要: 本发明公开了一种基于距离信息驱动的复杂工业图像异常检测方法及装置,方法为将待检测图像输入训练好的图像异常检测模型,获得异常定位图。本发明通过确定待检测物体中心并生成距离表示图像,可以学习物体每一块区域的特征分布,将不符合这种分布的区域判定为异常,能够有效的定位出复杂图片中每一个待检测物体的位置,并且能检测和定位出每一个待检测物体上可能存在的异常;在训练时不使用任何真实的异常图像,通过引入大模型对待检测物体进行分割,在获取了真实物体分割图像的同时指导小型分割模型的训练,以便在测试阶段摆脱对大模型的依赖,以较低的成本使模型同时具有分割待检测物体和物体上异常的能力。
-
公开(公告)号:CN117809123B
公开(公告)日:2024-05-14
申请号:CN202410227319.1
申请日:2024-02-29
申请人: 南京信息工程大学
IPC分类号: G06V10/764 , G06V10/26 , G06F16/51 , G06F16/532 , G06F16/583 , G06V10/774 , G06V10/82
摘要: 本发明公开了一种双阶段图像的异常检测与重构方法及系统,方法包括:将输入图像输入至预设的图像分割模型获得异常掩码图#imgabs0#;将所述异常掩码图#imgabs1#中的伪异常区域所对应在输入图像的区域记为可疑异常区域#imgabs2#;将输入图像的可疑异常区域#imgabs3#替换为相似图像对应的区域获得叠加图像#imgabs4#;对叠加图像#imgabs5#进行灰度化处理后输入预设的图像重构模型获得重构图像#imgabs6#;逐像素比较重构图像#imgabs7#与输入图像之间的差异获得异常得分,根据异常得分对输入图像的异常区域进行定位和判断;本发明不仅可以重构正常图片细节,还可以有效重构大面积的异常,进而增加整体的异常检测精度。
-
公开(公告)号:CN117876939A
公开(公告)日:2024-04-12
申请号:CN202410270021.9
申请日:2024-03-11
申请人: 南京信息工程大学
IPC分类号: G06V20/40 , G06V40/20 , G06V10/42 , G06V10/44 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
摘要: 本发明公开了一种基于时空特征增强的实时时空行为检测方法及装置,方法包括:将待检测的视频数据输入训练好的检测网络,得到实时时空行为检测结果;检测网络的训练包括:将原始视频截取为多个等时长的视频片段,将每个视频片段截取固定帧数的图像;对视频片段和其中的关键帧进行特征提取,得到时空特征和空间解耦特征;将时空特征输入到轻量时空扩张增强模块,得到时空增强特征;将时空增强特征进行上采样操作并与空间解耦特征在空间维度上对齐连接,将连接后的特征输入多尺度特征融合模块作为动作分类及定位的依据;优化损失函数并重复训练使得检测网络收敛,得到训练好的检测网络。本发明有效权衡了检测精度和速度,适用于实时行为检测任务。
-
公开(公告)号:CN116385807B
公开(公告)日:2023-09-12
申请号:CN202310621436.1
申请日:2023-05-30
申请人: 南京信息工程大学
IPC分类号: G06V10/764 , G06V10/56 , G06V10/26
摘要: 本发明公开了一种异常图像样本生成方法及装置,步骤1:获取标准化图像;步骤2:进行像素点采样;步骤3:进行分类确定标准化图像的颜色分布情况;步骤4:生成区域的位置以及生成异常的大小;步骤5:随机选取对应所述所需区域大小的区域,确定随机区域,接着确定随机区域的位置,并在此位置根据所述生成异常的大小生成方框;步骤6:为生成的方框随机添加颜色滤镜、增大、旋转、填充、变色中的一种操作;步骤7:在操作后的方框对应位置处随机选择一个方向,重复步骤4和步骤5若干次,扩展生成多个方框,将包括所有方框的标准化图像作为最终的模拟异常图像。优点:保证了模拟出的异常能够拟合实际中的异常情况,更好的完成异常检测任务。
-
公开(公告)号:CN115754964A
公开(公告)日:2023-03-07
申请号:CN202211474711.3
申请日:2022-11-23
申请人: 南京信息工程大学
IPC分类号: G01S7/41 , G06F18/2415 , G06F18/214 , G06N3/0464 , G06N3/048 , G06N3/047 , G06N3/08
摘要: 本发明公开基于SE‑Res2Net‑101的多普勒雷达杂波识别与分类方法,包括提取基数据中的雷达反射率ZH、差分反射率ZDR、相关系数ρHV和差分传播相移率KDP数值数据;将提取的数值数据预处理生成数据集;构建SE‑Res2Net‑101模型;将训练集数据输入到SE‑Res2Net‑101中进行模型训练;将测试数据集输入到训练好的模型中,通过模型给出的预测概率来进行杂波判断。解决当前需要通过地面地形数字化模拟且需要提供DEM的杂波检测技术难题,从ZH、ZDR、ρHV和KDP变量进行建立杂波预测模型,基于SE注意力机制的残差卷积网络的识别多普勒雷达中的杂波并进行生物杂波与地杂波分类方法,提高准确度、加快预测速度更快。
-
公开(公告)号:CN115390164B
公开(公告)日:2023-01-31
申请号:CN202211322018.4
申请日:2022-10-27
申请人: 南京信息工程大学
摘要: 本发明公开了一种雷达回波外推预报方法及系统,本发明采用基于上下文信息融合及注意力机制的长短期记忆网络构建预测神经网络,通过上下文信息融合提高了输入数据之间的相关性和输入数据的时空细节特征,增强网络的短期依赖能力,通过注意力机制可拓宽预测单元的时间感受野来感知更多的时间动态,捕获更可靠的帧间运动信息,大大增强了降雨预测精准度。本发明克服了现有技术对上下文信息提取不足、预报时效短的缺点,实现了准确度更高的雷达回波外推预测。
-
公开(公告)号:CN114896968A
公开(公告)日:2022-08-12
申请号:CN202210649555.3
申请日:2022-06-10
申请人: 南京信息工程大学
IPC分类号: G06F40/279 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种基于自然语言处理的地质表头归并方法及装置,所述方法包括获取地质表头文本原始数据,对地质表头文本原始数据进行预处理;将所述预处理过的地质表头文本原始数据转化为包括词编号和词的词表,再利用所述词表将地质表头文本原始数据转化为词编号序列;将所述词编号序列输入预先建立的基于长短期记忆神经网络的表头归并模型,经过所述表头归并模型的嵌入层、LSTM层后输出特征向量;使用softmax对所述特征向量计算,得出地质表头文本所属标签类别的概率,输出表头文本的类别预测结果,本发明能够统筹地质表头文本数据集的局部和全局文本特征,具备良好的准确性和稳定性,有效提升地质表头文本类别预测的效果。
-
-
-
-
-
-
-
-
-