-
公开(公告)号:CN115240271A
公开(公告)日:2022-10-25
申请号:CN202210815445.X
申请日:2022-07-08
Applicant: 北方工业大学
IPC: G06V40/20 , G06V10/764 , G06V10/80 , G06V20/40
Abstract: 本发明公开一种基于时空建模的视频行为识别方法及系统,其中方法包括:S1:将完整的视频输入视频图像采样模块,采用分段随机视频帧采样方法进行视频图像采样,得到多个采样帧图像;S2:构建基于三元组损失函数的空间注意力模块,并对多个采样帧图像的动作部分进行特征提取,得到空间特征信息;S3:构建时间金字塔模块,并对得到的空间特征信息以不同帧速率进行采样,得到多组特征信息;S4:采用早期融合的方式对得到的多组特征信息进行融合,具体为采用add操作将多组特征的特征向量进行拼接;S5:将融合后的特征信息输入Softmax分类器进行视频行为分类,为每个视频行为生成一个概率标签,并输出识别结果。
-
公开(公告)号:CN114913599A
公开(公告)日:2022-08-16
申请号:CN202210502598.9
申请日:2022-05-09
Applicant: 北方工业大学
Abstract: 一种基于自动编码器的视频异常行为检测方法及系统,其方法包括:S1:对输入的视频进行等间隔下采样的预处理;S2:采用Vibe背景提取算法结合U‑Net图像分割网络对预处理后的视频图像序列中的图像进行目标与背景的分离;S3:将图像的目标与背景分别输入到双通道自编码器的不同通道,由对应通道中的编码器分别对目标与背景提取图像特征后,在双通道自编码器的隐含层将两个通道分别提取的两个特征进行特征融合,最后将融合后的特征送入解码器进行模型训练;S4:在训练好的模型中使用重构误差判别对输入的待检测样本进行异常行为检测,得到异常行为检测结果,从而解决背景变化对异常行为检测造成的不利影响,使得到的模型通用性更强,易于部署到不同场景。
-
公开(公告)号:CN108241849A
公开(公告)日:2018-07-03
申请号:CN201710750516.1
申请日:2017-08-28
Applicant: 北方工业大学
Abstract: 本发明公开一种基于视频的人体交互动作识别方法,包括以下步骤:S1:对输入的视频帧图像采用帧间差分法进行运动目标检测;S2:对处理后获得的运动目标进行特征提取,包括:S21:对处理后获得的运动目标采用局部时空特征与全局光流特征相结合的方式提取人体交互动作特征;S22:对所述光流和时空兴趣点进行描述,形成特征描述子HOF和HOG;S23;将所述局部时空特征与全局光流特征分别通过BP神经网络,以获得在某一特征下动作类别的概率矩阵;S3:通过对利用不同特征得到的概率矩阵赋予不同权值进行加权求和以得到融合概率矩阵,概率最大的动作类别即为该帧的动作类别;S4:将初始分类序列输入到改进的正态分布BP神经网络中,获得最终的交互动作分类。
-
公开(公告)号:CN104574421B
公开(公告)日:2017-05-24
申请号:CN201510047728.4
申请日:2015-01-29
Applicant: 北方工业大学
IPC: G06T7/33
Abstract: 本发明属于图像处理领域,具体而言,涉及一种大幅面小重合区域高精度多光谱图像配准方法及装置,其中,该方法包括对参考图像和待配准图像进行SIFT特征点提取;对提取的特征点进行匹配,获取参考图像和待配准图像的重合区域,得到初步的配准图像;利用随机抽样一致性算法筛选的内点,与最小二乘法拟合曲线结合,估算出初步变换矩阵;利用均方根误差RMSE对重合区域的特征点进行映射矩阵客观评价,筛除引起误差的误匹配点,迭代至配准图像精度达到亚像素级,获取精确变换矩阵。通过该方法本发明提高了大幅多光谱图像在少量重合区域时的配准精度。
-
公开(公告)号:CN105869166A
公开(公告)日:2016-08-17
申请号:CN201610188972.7
申请日:2016-03-29
Applicant: 北方工业大学
CPC classification number: G06K9/00342 , G06K9/00201 , G06T2207/10021
Abstract: 本发明公开了一种基于双目视觉的人体动作识别方法及系统,其中,该基于双目视觉的人体动作识别方法首先通过双目标定获取相机的内外参数,然后对左右相机分别拍摄的图像进行预处理及目标检测,以提取出目标轮廓,接着,从目标轮廓中提取出目标的边缘,之后,对左右两幅图像中的像素点进行匹配,将匹配的结果作为HMM模型进行训练的数据依据。按照上述方法训练出多个动作对应的HMM模型,当采集者在相机采集范围内做出动作时,可通过已训练好的多个HMM模型分别判断采集者做出相应动作的概率。本发明能够较准确的判断人体三维立体信息且运行成本较低。
-
公开(公告)号:CN105654501A
公开(公告)日:2016-06-08
申请号:CN201610096232.0
申请日:2016-02-22
Applicant: 北方工业大学
IPC: G06T7/00
CPC classification number: G06T2207/20004
Abstract: 本发明属于图像处理技术领域,具体说,涉及一种基于模糊阈值的自适应图像分割方法,包括:步骤1,对直方图进行预处理,获取具有双峰特性的图像直方图;步骤2,对预处理后的图像直方图进行梯度检测,确定波谷的位置;步骤3,根据波谷位置,确定波峰位置;步骤4,根据波峰的峰值,确定两临近波峰间的距离,并根据不同波峰间的距离计算不同图像的隶属函数窗宽大小;步骤5,确定分割阈值。实现了窗口宽度的自适应选取,并且有效改善了模糊阈值法对直方图呈不明显双峰的图像分割困难的缺点,拓展了模糊阈值图像分割方法的适用范围,改善了模糊阈值分割方法的分割效果。
-
公开(公告)号:CN104036488A
公开(公告)日:2014-09-10
申请号:CN201410184042.5
申请日:2014-05-04
Applicant: 北方工业大学
Abstract: 本发明公开了一种基于双目视觉的人体姿态动作研究方法,该方法首先通过双目标定获取相机的内外参数,接着从相机拍摄的图像中提取出各肤色区域的质心点的坐标,并对质心点进行匹配判断,然后以世界坐标系为基准求出匹配的质心点在世界坐标系中的坐标,最后根据质心点在世界坐标系中坐标判断人体的姿态及动作。本发明不需要拍摄大量图像,能够通过实时采集视频帧对人脸和双手等人体关键部位的质心点进行立体匹配,以获取人体关键部位之间的位置关系,运行成本较低。
-
-
-
-
-
-