一种基于显著信息的视频分类方法

发明授权

请登陆查看更多内容

专利标题： 一种基于显著信息的视频分类方法
申请号： CN201910407378.6

申请日： 2019-05-16
公开(公告)号： CN110263638B

公开(公告)日： 2023-04-18
发明人: 刘琚 , 刘晓玺 , 顾凌晨
申请人： 山东大学
申请人地址： 山东省济南市历下区经十路17923号
专利权人： 山东大学
当前专利权人： 山东大学
当前专利权人地址： 山东省济南市历下区经十路17923号
代理机构： 济南圣达知识产权代理有限公司
代理商 李健康
主分类号： G06V20/40
IPC分类号： G06V20/40 ; G06V10/46 ; G06V10/54 ; G06V10/52 ; G06V10/80 ; G06V10/764 ; G06V10/82 ; G06N3/0464 ; G06N3/048 ; G06N3/047 ; G06N3/084

摘要：

为了解决3D视频分类网络的特征包含较多冗余信息的问题，本发明提出了一种基于显著信息的视频分类方法。主要思想在于组合不同大小卷积核，搭建多个显著信息提取模块，获得多尺度、具有代表性的显著信息；此外，为了解决网络中传统池化单元对视频信息造成的大量损失，设计了一种卷积池化相结合的双路池化单元对显著信息提取模块的输出进行针对性池化操作；最终，为了加快网络的收敛速度，优化网络收敛路径，实现端到端的训练，本发明设计了一种全新的损失函数，最终实现更精准的视频分类。该方法可以产生具有精确表征能力的视频特征，其在动作识别和场景识别场景中进行了实验，均达到优异的效果，充分证明方法具有较强的泛化能力。

公开/授权文献

CN110263638A 一种基于显著信息的视频分类方法公开/授权日：2019-09-20

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06V	图像或视频识别或理解
G06V20/00	场景；特定场景元素（控制数码相机 H04N5/232）
G06V20/40	.在视频内容中（提取叠加文本 G06V20/62）（视频检索 G06F16/70）（在视频服务器中处理视频基本流H04N21/234）（在视频客户端中处理视频基本流H04N21/44）