基于视觉和语义特征协作与强化学习的视频摘要方法

发明公开

CN113569767A 基于视觉和语义特征协作与强化学习的视频摘要方法无效 - 驳回

请登陆查看更多内容

专利标题： 基于视觉和语义特征协作与强化学习的视频摘要方法
申请号： CN202110873724.7

申请日： 2021-07-30
公开(公告)号： CN113569767A

公开(公告)日： 2021-10-29
发明人: 钟睿 , 李陈鹏 , 肖地洋 , 王蕊 , 姚文进
申请人： 华中师范大学
申请人地址： 湖北省武汉市洪山区珞瑜路152号
专利权人： 华中师范大学
当前专利权人： 华中师范大学
当前专利权人地址： 湖北省武汉市洪山区珞瑜路152号
代理机构： 武汉科皓知识产权代理事务所
代理商 严彦
主分类号： G06K9/00
IPC分类号： G06K9/00 ; G06K9/46 ; G06N3/04 ; G06N3/08 ; G06F16/738

摘要：

本发明提供一种基于视觉和语义特征协作与强化学习的视频摘要方法，包括将视频文件分解成帧序列，按照帧的时间顺序依次使用深度神经网络提取语义特征和视觉显著性特征；经过Bi‑LSTM模型处理预测出各视频帧被选择为关键帧的初始概率；根据视觉显著性特征提取出空间注意力得分，归一化后利用调整因子对Bi‑LSTM模型产生的初始概率进行调制得到调制概率；根据调制概率，确定语义特征与视觉显著性特征均重要的关键帧，实现VSFB模型；将原始视频分为多个独立片段clip，计算选择的关键帧与其他帧之间索引调整的差异性奖励和代表性奖励，依据强化学习奖励机制，动态调整初始概率，加强VSFB模型在视频摘要中的学习，最后得到理想模型，实现从任意待处理视频中的摘要提取。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06K	图形数据读取（图像或视频识别或理解G06V）；数据的呈现；记录载体；处理记录载体
G06K9/00	识别模式的方法或装置（图形读取或将机械参数模式（例如力或存在）转换为电信号的方法或装置 G06K11/00）（图像或视频识别或理解 G06V）（语音识别 G10L15/00 )