-
公开(公告)号:CN119296183B
公开(公告)日:2025-04-18
申请号:CN202411816671.5
申请日:2024-12-11
Applicant: 华东交通大学
Abstract: 本发明属于图像识别领域,提出了一种基于多模态群体行为识别技术的交互行为识别方法及系统,通过设计一种多模态群体行为识别网络,包括图像分支子网络、文本分支子网络和关键点分支子网络,分别进行多模态特征处理,以避免通过单一模态信息进行识别时,由于群体间的交互行为和复杂的交互环境的因素,造成识别精度较低的问题,进一步符合实际检修情况,提高了整体识别的精度,又通过轻量化设计,提高了识别的效率,再进行群体之间和群体与交互目标之间的关系和交互增强,进一步的提高了识别的精度,避免了因为遮挡重叠造成的识别障碍,本发明提高了群体目标交互行为的识别准确性和效率。
-
公开(公告)号:CN119206635B
公开(公告)日:2025-04-04
申请号:CN202411743386.5
申请日:2024-11-30
Applicant: 华东交通大学
IPC: G06V20/52 , G06V20/54 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种基于数据融合的铁路检修群体行为识别方法及系统,属于群体行为识别技术领域;其中方法包括:对铁路检修监控视频的RGB数据进行特征处理,得到多个不同层级的提取特征,通过多尺度局部特征融合网络和时空注意力网络处理,以得到RGB时空注意力特征;获取RGB数据的坐标分支输出特征,将坐标分支输出特征与RGB时空注意力特征进行融合得到RGB目标特征;获取关键点数据中,对关键点数据进行处理得到关键点目标特征;最后,将RGB目标特征和关键点目标特征进行融合,得到识别特征;通过提取并融合不同尺度的关键特征,提高在铁路检修监控视频中复杂场景下群体行为识别的准确性和鲁棒性。
-
公开(公告)号:CN119229541A
公开(公告)日:2024-12-31
申请号:CN202411755323.1
申请日:2024-12-03
Applicant: 华东交通大学
IPC: G06V40/20 , G06V10/26 , G06V10/82 , G06T7/194 , G06V10/74 , G06N3/0455 , G06N3/0475 , G06N3/094 , G06V20/40
Abstract: 本发明涉及图像识别领域,提出一种基于生成对抗网络的人体危险行为识别方法及系统,通过先对视频图像进行区域分割,对图像中的人体行为区域和背景区域进行分割,以避免背景因素的干扰,降低人体行为识别的难度,提高了识别的准确性,根据方向梯度算法提取人体行为特征和运动信息,丰富了动态特征信息,增强了上下文的联系,进而提高了在时间序列上的识别准确性,再根据包括信息增强模块的生成对抗网络生成预测人体行为特征,以获取最终识别结果,增强了长距离依赖关系,使预测进一步的符合实际情况,本发明提高了人体危险行为识别方法的准确性。
-
公开(公告)号:CN116824495B
公开(公告)日:2024-10-11
申请号:CN202310756542.0
申请日:2023-06-26
Applicant: 华东交通大学
IPC: G06V20/52 , G06V20/40 , G06V10/80 , G06V10/774 , G06V10/764
Abstract: 本发明提出一种危险行为识别方法、系统、存储介质及计算机设备,该方法包括:视频信息进行视频特征提取和音频特征提取;对每个样本中的视频特征和音频特征均依次进行编码和投影,得到投影视频特征和投影音频特征,并根据投影视频特征和投影音频特征计算得到关于视频模态和音频模态的总损失值,并根据总损失值进行迭代训练;根据对比学习模型得到关于投影视频特征和投影音频特征的融合特征,并将至少一段视频信息对应的融合特征输入到N个基分类器中进行训练,得到多分类器加权投票模型,行为类型结果包括有危险和无危险。本发明能够更全面、准确的信息去描述行为,并提高危险预测的准确性,进而实现对群体危险行为的识别预测。
-
公开(公告)号:CN116363566B
公开(公告)日:2023-10-17
申请号:CN202310643957.7
申请日:2023-06-02
Applicant: 华东交通大学
IPC: G06V20/40 , G06V10/82 , G06N3/0464 , G06N3/08 , G06N5/02
Abstract: 本发明公开了一种基于关系知识图的目标交互关系识别方法,所述方法包括以下步骤:S1、构建用于判断多人交互场景中目标是否存在交互行为的交互估计框架;S2、基于所述交互估计框架提取输入训练图像中的特征信息,进而构建关系知识图;S3、提取待测试视频图像中目标的动作特征和交互目标位置特征以及背景物体特征,进而构建交互场景图,然后基于所构建的关系知识图和交互场景图对待测试视频图像中的多人交互关系进行识别判断。本发明通过提取输入视频图像中信息逻辑关系并构建关系知识图,并将关系知识图融入到交互关系的识别中,进而不同场景,不同物品,不同动作之间联系起来,有效增强了输入视频图像中交互关系的识别准确性。
-
公开(公告)号:CN116503914A
公开(公告)日:2023-07-28
申请号:CN202310760280.5
申请日:2023-06-27
Applicant: 华东交通大学
IPC: G06V40/10 , G06V20/52 , G06V10/44 , G06V10/46 , G06V10/762 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/048
Abstract: 本发明提出行人重识别方法、系统、可读存储介质及计算机设备,该方法包括:对历史行人图像进行特征提取;沿着水平坐标和垂直坐标分别对特征张量进行编码,并将水平特征和垂直特征进行级联转换,并根据在水平方向和在垂直方向上的中间特征图获取注意力特征图;根据注意力特征图获取池化核域中每个激活值所对应的激活权重,以根据激活权重对池化核域内所有激活值的加权求和;将加权求和值编码映射到欧式空间,以计算出样本的类中心,并根据样本的类中心计算出类中心三元组损失,并根据类中心三元组损失迭代训练出行人重识别模型。本发明能够传统技术行人重识别准确率较低的问题。
-
公开(公告)号:CN119251773B
公开(公告)日:2025-04-18
申请号:CN202411784566.8
申请日:2024-12-06
Applicant: 华东交通大学
IPC: G06V20/52 , G06V20/40 , G06V40/20 , G06V10/80 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/0499 , G06N3/0455 , G06T7/215
Abstract: 本申请涉及智能监控和计算机视觉技术领域,公开了一种面向客运站群体的行为识别方法、系统、设备及介质,该方法包括:获取目标客运站群体的视频帧图像并进行预处理,分别提取对应的RGB图像、深度图、骨骼图和光流图;根据RGB图像提取RGB特征,根据深度图提取深度图特征,根据RGB特征和深度图特征得到早期融合特征;根据骨骼图捕捉骨骼特征,根据光流图捕捉光流特征,根据骨骼特征和光流特征得到中期融合特征;根据早期融合特征和中期融合特征得到后期融合特征,根据后期融合特征获得视频帧图像对应的行为类别预测结果。该方法能够在铁路客运站等复杂环境中,利用多特征数据进行密集型群体行为的精准识别。
-
公开(公告)号:CN119296183A
公开(公告)日:2025-01-10
申请号:CN202411816671.5
申请日:2024-12-11
Applicant: 华东交通大学
Abstract: 本发明属于图像识别领域,提出了一种基于多模态群体行为识别技术的交互行为识别方法及系统,通过设计一种多模态群体行为识别网络,包括图像分支子网络、文本分支子网络和关键点分支子网络,分别进行多模态特征处理,以避免通过单一模态信息进行识别时,由于群体间的交互行为和复杂的交互环境的因素,造成识别精度较低的问题,进一步符合实际检修情况,提高了整体识别的精度,又通过轻量化设计,提高了识别的效率,再进行群体之间和群体与交互目标之间的关系和交互增强,进一步的提高了识别的精度,避免了因为遮挡重叠造成的识别障碍,本发明提高了群体目标交互行为的识别准确性和效率。
-
公开(公告)号:CN116503914B
公开(公告)日:2023-09-01
申请号:CN202310760280.5
申请日:2023-06-27
Applicant: 华东交通大学
IPC: G06V40/10 , G06V20/52 , G06V10/44 , G06V10/46 , G06V10/762 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/048
Abstract: 本发明提出行人重识别方法、系统、可读存储介质及计算机设备,该方法包括:对历史行人图像进行特征提取;沿着水平坐标和垂直坐标分别对特征张量进行编码,并将水平特征和垂直特征进行级联转换,并根据在水平方向和在垂直方向上的中间特征图获取注意力特征图;根据注意力特征图获取池化核域中每个激活值所对应的激活权重,以根据激活权重对池化核域内所有激活值的加权求和;将加权求和值编码映射到欧式空间,以计算出样本的类中心,并根据样本的类中心计算出类中心三元组损失,并根据类中心三元组损失迭代训练出行人重识别模型。本发明能够传统技术行人重识别准确率较低的问题。
-
公开(公告)号:CN119251773A
公开(公告)日:2025-01-03
申请号:CN202411784566.8
申请日:2024-12-06
Applicant: 华东交通大学
IPC: G06V20/52 , G06V20/40 , G06V40/20 , G06V10/80 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/0499 , G06N3/0455 , G06T7/215
Abstract: 本申请涉及智能监控和计算机视觉技术领域,公开了一种面向客运站群体的行为识别方法、系统、设备及介质,该方法包括:获取目标客运站群体的视频帧图像并进行预处理,分别提取对应的RGB图像、深度图、骨骼图和光流图;根据RGB图像提取RGB特征,根据深度图提取深度图特征,根据RGB特征和深度图特征得到早期融合特征;根据骨骼图捕捉骨骼特征,根据光流图捕捉光流特征,根据骨骼特征和光流特征得到中期融合特征;根据早期融合特征和中期融合特征得到后期融合特征,根据后期融合特征获得视频帧图像对应的行为类别预测结果。该方法能够在铁路客运站等复杂环境中,利用多特征数据进行密集型群体行为的精准识别。
-
-
-
-
-
-
-
-
-