发明公开
- 专利标题: 基于视觉和语义特征协作与强化学习的视频摘要方法
-
申请号: CN202110873724.7申请日: 2021-07-30
-
公开(公告)号: CN113569767A公开(公告)日: 2021-10-29
- 发明人: 钟睿 , 李陈鹏 , 肖地洋 , 王蕊 , 姚文进
- 申请人: 华中师范大学
- 申请人地址: 湖北省武汉市洪山区珞瑜路152号
- 专利权人: 华中师范大学
- 当前专利权人: 华中师范大学
- 当前专利权人地址: 湖北省武汉市洪山区珞瑜路152号
- 代理机构: 武汉科皓知识产权代理事务所
- 代理商 严彦
- 主分类号: G06K9/00
- IPC分类号: G06K9/00 ; G06K9/46 ; G06N3/04 ; G06N3/08 ; G06F16/738
摘要:
本发明提供一种基于视觉和语义特征协作与强化学习的视频摘要方法,包括将视频文件分解成帧序列,按照帧的时间顺序依次使用深度神经网络提取语义特征和视觉显著性特征;经过Bi‑LSTM模型处理预测出各视频帧被选择为关键帧的初始概率;根据视觉显著性特征提取出空间注意力得分,归一化后利用调整因子对Bi‑LSTM模型产生的初始概率进行调制得到调制概率;根据调制概率,确定语义特征与视觉显著性特征均重要的关键帧,实现VSFB模型;将原始视频分为多个独立片段clip,计算选择的关键帧与其他帧之间索引调整的差异性奖励和代表性奖励,依据强化学习奖励机制,动态调整初始概率,加强VSFB模型在视频摘要中的学习,最后得到理想模型,实现从任意待处理视频中的摘要提取。