-
公开(公告)号:CN112861758A
公开(公告)日:2021-05-28
申请号:CN202110207458.4
申请日:2021-02-24
Applicant: 中国矿业大学(北京)
Abstract: 本发明公开了一种基于弱监督学习视频分割的行为识别方法,其中方法包括:将整个视频分割成未知数量的N段,为每一段分配类标签和长度标签,对视频段使用Viterbi算法生成帧标签用于计算逐帧的交叉熵损失;在由Viterbi算法得到初始视频分割中找到最佳的动作分割点,对初始视频分割进行分解得到视觉模型、长度模型、上下文模型;使用单层具有256个循环门单元和softmax输出的GRU网络在前向传播中连接输入数据序列,得到后验概率和长度模型;定义辅助函数,找到最佳分割点;最终由长度模型和辅助函数得到完整视频的最大可能分割。充分利用弱监督视频,对完整视频中的动作进分割。
-
公开(公告)号:CN110222653B
公开(公告)日:2020-06-16
申请号:CN201910499246.0
申请日:2019-06-11
Applicant: 中国矿业大学(北京)
Abstract: 本发明公开了一种基于图卷积神经网络的骨架数据行为识别方法,其中,方法包括:通过对训练集中的每一段骨架数据的时间维度进行下采样获得时间维度固定的骨架数据,以训练神经网络;将输入数据按照三维坐标拆分成三个通道,对每一个空间通道分别做带双重注意力的图卷积,再将三个通道合并;对合并后的向量作时空卷积;通过标注动作类别更新神经网络权重;最终获得和指定标注结果强相关的行为识别模型。该方法充分利用骨架数据的拓扑结构和时空关系,提高行为识别性能。
-
公开(公告)号:CN112861758B
公开(公告)日:2021-12-31
申请号:CN202110207458.4
申请日:2021-02-24
Applicant: 中国矿业大学(北京)
Abstract: 本发明公开了一种基于弱监督学习视频分割的行为识别方法,其中方法包括:将整个视频分割成未知数量的N段,为每一段分配类标签和长度标签,对视频段使用Viterbi算法生成帧标签用于计算逐帧的交叉熵损失;在由Viterbi算法得到初始视频分割中找到最佳的动作分割点,对初始视频分割进行分解得到视觉模型、长度模型、上下文模型;使用单层具有256个循环门单元和softmax输出的GRU网络在前向传播中连接输入数据序列,得到后验概率和长度模型;定义辅助函数,找到最佳分割点;最终由长度模型和辅助函数得到完整视频的最大可能分割。充分利用弱监督视频,对完整视频中的动作进分割。
-
公开(公告)号:CN110222653A
公开(公告)日:2019-09-10
申请号:CN201910499246.0
申请日:2019-06-11
Applicant: 中国矿业大学(北京)
Abstract: 本发明公开了一种基于图卷积神经网络的骨架数据行为识别方法,其中,方法包括:通过对训练集中的每一段骨架数据的时间维度进行下采样获得时间维度固定的骨架数据,以训练神经网络;将输入数据按照三维坐标拆分成三个通道,对每一个空间通道分别做带双重注意力的图卷积,再将三个通道合并;对合并后的向量作时空卷积;通过标注动作类别更新神经网络权重;最终获得和指定标注结果强相关的行为识别模型。该方法充分利用骨架数据的拓扑结构和时空关系,提高行为识别性能。
-
-
-