-
公开(公告)号:CN115880574A
公开(公告)日:2023-03-31
申请号:CN202310188520.9
申请日:2023-03-02
Applicant: 吉林大学
IPC: G06V20/05 , G06V10/25 , G06V10/774 , G06V10/82 , G06N3/0464
Abstract: 本发明具体涉及一种水下光学图像轻量化目标识别方法、设备和介质,其特征在于,所述方法包括如下步骤:S1、收集水下光学图像数据集,将数据集分为训练集和测试集,并对训练集进行标注;S2、对训练集进行特征提取,捕捉场景中角色的时空信息和交互信息,并输出相应特征图;S3、构建训练网络对步骤S2中的特征图进行训练,所述训练网络中,针对学习率采用一致衰减策略,针对网络结构采用交错分组策略,针对训练方法采用多尺度聚合模块与短/长聚合模块相结合;S4、将经过充分训练的训练集参数加载到训练网络中,将测试集图像输入,测试获得最终结果。提高水下光学图像目标识别的计算速度和存储能力,有利于性能的提升和资源的配置。
-
公开(公告)号:CN117690190B
公开(公告)日:2024-08-13
申请号:CN202410130129.8
申请日:2024-01-31
Applicant: 吉林大学
IPC: G06V40/20 , G06V20/05 , G06V10/34 , G06V10/426 , G06V10/44 , G06V10/52 , G06V10/62 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/084 , G06N3/0895
Abstract: 本发明属于水下动作识别技术领域,本发明公开了基于超图文本对比的水下动作识别方法、系统及存储介质,包括以下步骤:获取水下动作基准数据集;基于姿态估计法提取水下各种动作指令下的水下人体骨骼数据;对基本人体骨骼进行分区设计,建立关于骨骼关节点的超边,进而获得超图;将所述超图和所述水下人体骨骼数据进行结合,输出水下骨骼的超边特征;基于Transformer模型,输出骨骼特征,将所述骨骼特征和所述文本模型中的文本特征进行对比学习,最终输出精确的潜水员动作指令识别结果。本发明,将超图与输入特征结合推到超边特征,采用文本编码器生成文本特征,实现骨骼‑文本的对比学习,有效地利用多模态信息进一步提升潜水员动作识别的效能。
-
公开(公告)号:CN117893894B
公开(公告)日:2024-06-11
申请号:CN202410294510.8
申请日:2024-03-15
Applicant: 吉林大学
IPC: G06V20/05 , G06N3/045 , G06N3/0464 , G06N3/0495 , G06N3/08 , G06V10/25 , G06V10/82
Abstract: 一种基于红外偏振图像的水下目标轻量化检测方法及装置,涉及水下机器视觉目标检测技术领域,方法包括:基于红外偏振相机采集水下目标红外偏振图像;将所述目标红外偏振图像划分为训练集和测试集;设计增强特征提取模块,并插入SlimNeck网络中,构成轻量化颈部网络;设计轻量化检测头SlimDetect,并采用所述轻量化检测头SlimDetect和所述轻量化颈部网络替换单阶段目标检测模型中的对应部分,得到轻量化目标检测模型;基于所述训练集训练所述轻量化目标检测模型;将训练后的轻量化目标检测模型用于水下目标检测;该方法通过轻量化设计,减少模型的参数量和计算复杂度,使得在资源有限的水下设备上实现实时目标检测成为可能。
-
公开(公告)号:CN117649597B
公开(公告)日:2024-05-14
申请号:CN202410114303.X
申请日:2024-01-29
Applicant: 吉林大学
IPC: G06V20/05 , G06V20/40 , G06V20/64 , G06V40/20 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0499 , G06N3/082
Abstract: 一种基于事件相机的水下三维手部姿态估计方法和系统,涉及水下机器视觉的技术领域。解决在静态的手势重建方法在水下环境中具有局限性的问题。所述方法包括:利用事件相机采集水下潜水员手势视频,将手势视频转换成事件序列,构建数据集;对所述事件序列进行体素化,并通过体素网格方式进行数据表示;利用高斯滤波器处理体素网格形式的事件序列进行滤波处理,获取清洗后的事件序列;构建视频观测模型,获取估计值;使用卡尔曼滤波器对估计值进行处理并生成蒙皮参数;根据蒙皮参数生成蒙皮的可视化结果,完成水下三维手部姿态估计。应用于水下动态手部姿态估计领域。
-
公开(公告)号:CN117745596A
公开(公告)日:2024-03-22
申请号:CN202410182761.7
申请日:2024-02-19
Applicant: 吉林大学
IPC: G06T5/77 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/0499 , G06N3/08 , G06T5/50 , G06T5/60
Abstract: 一种基于跨模态融合的水下去遮挡方法。本发明属于水下机器视觉的技术领域,具体而言,涉及事件和RGB两种数据模态深度融合方法,以及基于事件和RGB数据的水下场景去遮挡重建方法。本发明提供了一种基于跨模态融合的水下去遮挡方法,解决了现有技术中在水下去遮挡时都是先将事件序列与RGB图像各自的特征先进行编码后再融合,此种处理方式容易导致模型计算量和硬件要求翻倍,无法适配于资源受限的水下环境的问题。本发明所述方法将事件序列与RGB图像直接进行融合,然后再进行编码解码,在前融合阶段进行数据融合,减少了系统对计算量的要求,使网络更加轻量化。
-
公开(公告)号:CN117649597A
公开(公告)日:2024-03-05
申请号:CN202410114303.X
申请日:2024-01-29
Applicant: 吉林大学
IPC: G06V20/05 , G06V20/40 , G06V20/64 , G06V40/20 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0499 , G06N3/082
Abstract: 一种基于事件相机的水下三维手部姿态估计方法和系统,涉及水下机器视觉的技术领域。解决在静态的手势重建方法在水下环境中具有局限性的问题。所述方法包括:利用事件相机采集水下潜水员手势视频,将手势视频转换成事件序列,构建数据集;对所述事件序列进行体素化,并通过体素网格方式进行数据表示;利用高斯滤波器处理体素网格形式的事件序列进行滤波处理,获取清洗后的事件序列;构建视频观测模型,获取估计值;使用卡尔曼滤波器对估计值进行处理并生成蒙皮参数;根据蒙皮参数生成蒙皮的可视化结果,完成水下三维手部姿态估计。应用于水下动态手部姿态估计领域。
-
公开(公告)号:CN116561649B
公开(公告)日:2023-09-12
申请号:CN202310832974.5
申请日:2023-07-10
Applicant: 吉林大学
IPC: G06F18/24 , G06N3/048 , G06F16/22 , G06F18/10 , G06F18/15 , G06F18/213 , G06F18/25 , A61B5/11 , G01C21/16
Abstract: 基于多源传感器数据的潜水员运动状态识别方法和系统,解决了基于视觉方法在低光场景下的人体识别效果差的问题。涉及水下潜水员运动状态识别领域。方法包括:通过惯性传感器采集潜水员的水下活动的数据,并将数据存储在数据库中;对数据进行分割组成事件序列,并嵌入活动级上下文信息;建立词典,将事件序列中的每一个传感器事件转化为词索引,并建立嵌入矩阵;基于Transformer的GIF特征提取模块提取嵌入矩阵的特征,获得特征向量;利用一维平均池化层和带Softmax激活函数的全连接层对特征向量进行处理,获取识别模型,输出每个类别的预测概率,最终得到潜水员的姿态识别结果。本发明应用于水下目标识别领域。
-
公开(公告)号:CN116682000A
公开(公告)日:2023-09-01
申请号:CN202310936412.5
申请日:2023-07-28
Applicant: 吉林大学
IPC: G06V20/05 , G06N3/0464 , G06N3/08 , G06V10/80 , G06V10/82
Abstract: 一种基于事件相机的水下蛙人目标检测方法。属于水下机器视觉目标检测技术领域,具体涉及水下蛙人目标检测领域。其解决了以往的水下蛙人目标检测缺乏鲁棒性强的特征信息的问题。所述方法具体为:利用事件相机获取水下蛙人事件序列和RGB图像,设计RGB残差学习模块,用于充分提取水下蛙人RGB图像空间特征信息,设计事件残差学习模块,用于充分提取水下蛙人事件图像纹理特征信息,设计特征融合网络,使水下蛙人RGB图像特征信息与水下蛙人事件图像特征信息进行细粒度特征融合。本发明所述方法可以应用在水下目标检测技术领域、水下航行安全检测领域以及水下目标识别设备制造领域。
-
公开(公告)号:CN115941872B
公开(公告)日:2023-06-16
申请号:CN202310076491.7
申请日:2023-02-08
Applicant: 吉林大学
IPC: H04N7/01 , H04N5/265 , G06N3/0464
Abstract: 本发明涉及模式识别技术领域,具体涉及一种水下高速移动目标的视频插帧方法即其系统。步骤1:通过传统相机获取RGB数据;步骤2:基于步骤1的RGB图像,抽离出RGB图像的背景轮廓图;步骤3:利用步骤2的背景轮廓图和步骤1得到的RGB数据经过轮廓图辅助多尺度光流估计网络进行光流估计;步骤4:利用RGB数据和步骤3估计的光流经过光流优化网络对光流结果进行优化;步骤5:利用网型融合网络,融合帧光流估计网络与光流优化网络输出的光流结果,对光流结果进行扭曲得到的中间帧,最终输出中间帧。本发明用以解决现有技术中无法非常准确地还原出非线性运动两帧间的中间帧的问题。
-
公开(公告)号:CN115880574B
公开(公告)日:2023-06-16
申请号:CN202310188520.9
申请日:2023-03-02
Applicant: 吉林大学
IPC: G06V20/05 , G06V10/25 , G06V10/774 , G06V10/82 , G06N3/0464
Abstract: 本发明具体涉及一种水下光学图像轻量化目标识别方法、设备和介质,其特征在于,所述方法包括如下步骤:S1、收集水下光学图像数据集,将数据集分为训练集和测试集,并对训练集进行标注;S2、对训练集进行特征提取,捕捉场景中角色的时空信息和交互信息,并输出相应特征图;S3、构建训练网络对步骤S2中的特征图进行训练,所述训练网络中,针对学习率采用一致衰减策略,针对网络结构采用交错分组策略,针对训练方法采用多尺度聚合模块与短/长聚合模块相结合;S4、将经过充分训练的训练集参数加载到训练网络中,将测试集图像输入,测试获得最终结果。提高水下光学图像目标识别的计算速度和存储能力,有利于性能的提升和资源的配置。
-
-
-
-
-
-
-
-
-