基于多重文本提示的弱监督视频异常检测方法

    公开(公告)号:CN119206563A

    公开(公告)日:2024-12-27

    申请号:CN202411097071.8

    申请日:2024-08-12

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于多重提示学习的弱监督视频异常检测方法,包括:1)将视频数据通过视频特征提取器提取得到原始特征;2)将原始特征输入到全局‑局部时间依赖性网络获得时间增强特征;3)将标签文本分别通过知识图谱和待学习提示获得两种不同的提示信息;4)将两种提示信息与时间增强特征进行跨模态融合;5)将时间增强特征通过片段分类器获得片段异常得分,通过设计损失函数来优化网络实现视频的异常检测任务。本发明只利用视频级标签,通过构造自注意力的双分支结构来提取片段的全局和局部时间依赖关系,并通过两种不同方式提取文本提示信息与片段特征进行跨模态融合,补充了视频的异常信息,有效提升了视频异常检测的准确度。

Patent Agency Ranking