一种面向医疗视频中区域遮挡的医护行为识别方法

    公开(公告)号:CN117726821B

    公开(公告)日:2024-05-10

    申请号:CN202410165468.X

    申请日:2024-02-05

    Abstract: 本发明提供一种面向医疗视频中区域遮挡的医护行为识别方法,涉及视频识别技术领域,包括:获取医护视频,利用预训练的检测器对医护视频进行主体检测,得到医护主体轨迹;在医护视频的第一帧中,通过约束条件在背景区域中获得伪遮挡补丁,将伪遮挡补丁粘贴至医护主体上;对于医护视频的剩余帧,根据医护主体轨迹添加时间轨迹,得到带有伪遮挡补丁的医护主体轨迹;令静态分支数据和动态分支数据进行互学习,并训练医护识别网络,得到医护识别模型;获取新的医护视频,利用医护识别模型对新的医护视频进行识别,得到医护主体及医护主体行为轨迹。本发明能够解决医护人员或患者行为主体运动时产生的区域遮挡问题。

    一种面向医疗视频中区域遮挡的医护行为识别方法

    公开(公告)号:CN117726821A

    公开(公告)日:2024-03-19

    申请号:CN202410165468.X

    申请日:2024-02-05

    Abstract: 本发明提供一种面向医疗视频中区域遮挡的医护行为识别方法,涉及视频识别技术领域,包括:获取医护视频,利用预训练的检测器对医护视频进行主体检测,得到医护主体轨迹;在医护视频的第一帧中,通过约束条件在背景区域中获得伪遮挡补丁,将伪遮挡补丁粘贴至医护主体上;对于医护视频的剩余帧,根据医护主体轨迹添加时间轨迹,得到带有伪遮挡补丁的医护主体轨迹;令静态分支数据和动态分支数据进行互学习,并训练医护识别网络,得到医护识别模型;获取新的医护视频,利用医护识别模型对新的医护视频进行识别,得到医护主体及医护主体行为轨迹。本发明能够解决医护人员或患者行为主体运动时产生的区域遮挡问题。

    基于信任风险分配令牌的识别方法、系统及电子设备

    公开(公告)号:CN118570711B

    公开(公告)日:2024-11-08

    申请号:CN202411059390.X

    申请日:2024-08-03

    Abstract: 本发明提出了一种基于信任风险分配令牌的识别方法、系统及电子设备,属于视频识别领域,方法包括:S1、获取无人机视角的视频序列,将所述视频序列输入至Vision Transformer主干网络中,利用3D卷积对视频序列进行时空特征提取,得到中间特征和中间特征的类别分数;S2、使用快速傅里叶变换进行频域信息分析,得到动态显著性水平分数;S3、根据动态显著性水平分数将中间特征中的令牌分为主动令牌和被动令牌;S4、计算每个被动令牌的预测不确定性分数;S5、预测不确定性分数对被动令牌进行排序和筛选;S6、对主动令牌和优化后的被动令牌进行特征提取,得到视频序列中的行为。

    一种基于动作感知的视频描述方法及系统

    公开(公告)号:CN118172829A

    公开(公告)日:2024-06-11

    申请号:CN202410262500.6

    申请日:2024-03-07

    Abstract: 本发明公开了一种基于动作感知的视频描述方法及系统,属于视频描述技术领域,所述方法包括:分别提取每个待描述视频的原始视觉特征;将原始视觉特征输入动作识别预测器,得到高级动作语义特征;将原始视觉特征与动作语义信息进行特征融合,得到动作融合视觉特征;将动作融合视觉特征输入长度预测器,并通过非自回归解码器生成视频描述文本;将动作融合视觉特征输入视觉词解码器,生成视觉词,并将视觉词映射成待描述视频的语言骨架标签;构建多尺度语义骨架损失函数,对视频描述文本进行语言骨架级优化。本发明的方法具备动作感知能力,减少视频中低级错误动作信息的影响,从语言骨架级对描述文本进行优化,从而提升生成的视频描述的精细度。

    一种基于动作感知的视频描述方法及系统

    公开(公告)号:CN118172829B

    公开(公告)日:2024-09-10

    申请号:CN202410262500.6

    申请日:2024-03-07

    Abstract: 本发明公开了一种基于动作感知的视频描述方法及系统,属于视频描述技术领域,所述方法包括:分别提取每个待描述视频的原始视觉特征;将原始视觉特征输入动作识别预测器,得到高级动作语义特征;将原始视觉特征与动作语义信息进行特征融合,得到动作融合视觉特征;将动作融合视觉特征输入长度预测器,并通过非自回归解码器生成视频描述文本;将动作融合视觉特征输入视觉词解码器,生成视觉词,并将视觉词映射成待描述视频的语言骨架标签;构建多尺度语义骨架损失函数,对视频描述文本进行语言骨架级优化。本发明的方法具备动作感知能力,减少视频中低级错误动作信息的影响,从语言骨架级对描述文本进行优化,从而提升生成的视频描述的精细度。

    基于信任风险分配令牌的识别方法、系统及电子设备

    公开(公告)号:CN118570711A

    公开(公告)日:2024-08-30

    申请号:CN202411059390.X

    申请日:2024-08-03

    Abstract: 本发明提出了一种基于信任风险分配令牌的识别方法、系统及电子设备,属于视频识别领域,方法包括:S1、获取无人机视角的视频序列,将所述视频序列输入至Vision Transformer主干网络中,利用3D卷积对视频序列进行时空特征提取,得到中间特征和中间特征的类别分数;S2、使用快速傅里叶变换进行频域信息分析,得到动态显著性得分;S3、根据动态显著性得分将中间特征中的令牌分为主动令牌和被动令牌;S4、计算每个被动令牌的预测不确定性分数;S5、预测不确定性分数对被动令牌进行排序和筛选;S6、对主动令牌和优化后的被动令牌进行特征提取,得到视频序列中的行为。

Patent Agency Ranking