一种融合领域知识和多阶深度特征的篮球比赛语义事件识别方法

    公开(公告)号:CN108681712B

    公开(公告)日:2022-01-28

    申请号:CN201810475535.2

    申请日:2018-05-17

    Abstract: 一种基于融合领域知识和深度多阶特征的篮球比赛语义事件识别方法,实现对篮球比赛中语义事件的自动识别。随着计算机视觉理论与深度神经网络的不断发展,基于内容的视频语义事件分析技术不断完善。该方案首先基于篮球领域先验知识对篮球语义事件划分为事件准备阶段,事件发生阶段和事件后续阶段。然后提取视频序列的全局和群体运动模式,随后通过分层网络对多阶段网络提取的特征进行融合,最后通过长短期记忆网络实现时域信息整合,实现篮球语义事件的识别。此发明对大规模篮球视频数据的智能化存储与检索以及篮球视频专业自动化战术分析奠定了基础。

    一种基于局部图卷积网络的排球群体行为识别方法

    公开(公告)号:CN113297936A

    公开(公告)日:2021-08-24

    申请号:CN202110531225.X

    申请日:2021-05-17

    Abstract: 一种基于局部图卷积网络的排球群体行为识别方法,涉及智能媒体计算和计算机视觉领域;首先对训练视频样本进行时域稀疏采样,对采样出的视频帧使用卷积神经网络提取全图特征图,并利用RoI Align根据图像中的个体候选框的位置提取个体视觉特征图;其次建立个体自连接图模型和个体间连接图模型,并以图卷积网络对图模型中的个体局部特征进行交互信息的传递得到关系特征图,并将其与个体视觉特征图进行融合;将训练样本进行预处理后传入网络中,利用损失函数和优化器对模型的参数进行迭代更新直至达到收敛,完成训练;最后将测试数据送入网络中,得到模型对测试数据的预测结果以及分类准确率。本发明有助于提升群体行为识别算法的性能。

    一种基于全局运动统计特征的团队体育视频关键帧提取方法

    公开(公告)号:CN113032631A

    公开(公告)日:2021-06-25

    申请号:CN202110204179.2

    申请日:2021-02-24

    Abstract: 一种基于全局运动统计特征的团队体育视频关键帧提取方法属于视频分析领域。首先对视频进行预处理,以镜头为单位切分视频并提取比赛镜头将其结构化;然后估计视频帧对应的全局运动,并计算视频帧对应的全局运动统计特征;进一步基于镜头的水平平移量,将镜头视频片段进一步切分为细粒度视频片段;再根据全局运动统计特征来提取候选关键帧,最后结合时空一致性与层次聚类从候选关键帧集合中提取代表性关键帧以去除冗余帧来得到最终的关键帧集合。本发明充分利用了团队体育视频的全局运动信息,提高了关键帧提取性能,减少了冗余光流信息的干扰,有利于提升所提取出的关键帧与比赛中关键事件的相关性。

    一种基于FCN和CNN的云图分割方法

    公开(公告)号:CN107016677B

    公开(公告)日:2020-01-17

    申请号:CN201710182281.0

    申请日:2017-03-24

    Abstract: 一种基于FCN和CNN的云图分割方法属于计算机视觉的图像分割领域。其特征在于:首先通过超像素对云图中每个像素点的近邻域实现相应的聚类同时将云图输入到不同步长的全卷积神经网络FCN32s和FCN8s中,实现云图的预分割结果;FCN32s结果图中的黑色区域一定是云图中的一部分“非云”区域,FCN8s结果图中的白色区域一定是云图中的一部分“云”区域;剩下不确定的区域即灰色区域需要通过深度卷积神经网络CNN来确定,需要选取超像素区域中的关键像素来代表超像素区域的特征,像素的特征通过CNN网络来判断是“云”或者是“非云”。本发明发现而精度与MR‑CNN、SP‑CNN相当,但是速度相比于MR‑CNN提高了880倍,相比于SP‑CNN提高了1.657倍。

    一种融合运动模式和关键视觉信息的篮球视频语义事件识别方法

    公开(公告)号:CN110210383A

    公开(公告)日:2019-09-06

    申请号:CN201910466869.8

    申请日:2019-05-31

    Abstract: 一种融合运动模式和关键视觉信息的篮球视频语义事件识别方法属于视频语义事件识别领域。为实现篮球视频中的语义事件自动识别,首先基于相机镜头变化的固有属性,将混叠运动分解为全局运动和局部运动。然后基于这两种模态的数据,应用双流3D卷积神经网络网络,实现篮球视频中的群体活动的识别。随后,应用卷积神经网络对篮框区域的表观特征变化进行表达,实现事件成功失败的判别。最后,融合这两部分的预测结果,实现篮球视频中的语义事件识别。此发明对篮球视频数据智能化管理、篮球技战术分析和自动转播等应用奠定了基础。

    一种结合关键运动特征和颜色特征的镜头边界检测方法

    公开(公告)号:CN110210379A

    公开(公告)日:2019-09-06

    申请号:CN201910462263.7

    申请日:2019-05-30

    Abstract: 一种结合关键运动特征和颜色特征的镜头边界检测方法属于图像处理领域,目前网络中存在着大量没有分类信息的视频文件,为了方便用户准确高效地寻找自己感兴趣的视频,自动提取视频的语义信息并将它们分类是现在亟需解决的问题。而镜头边界检测在视频语义分析问题中起着基础而重要的作用,它可以有效找到视频中不同关键信息的分界点。关键运动特征由光流估计方法提取,颜色特征由颜色直方图方法提取,两种方法的结合有助于准确地找到镜头边界帧,从而辅助完成视频语义分析和视频分类的任务。通过实验证明本方法优于目前已有的镜头边界检测方法,具有很高的应用价值。

    一种社交策展网络上采集(Pin)的多模态表示方法

    公开(公告)号:CN108876643A

    公开(公告)日:2018-11-23

    申请号:CN201810505633.6

    申请日:2018-05-24

    Abstract: 一种社交策展网络上采集(Pin)的多模态表示方法涉及智能媒体计算和大数据分析技术领域。对于给定采集,其图片经图像缩放、图像裁剪等预处理后;输入到一个在自动标注的图像数据集上训练的卷积神经网络(CNN)中,CNN的前向传播完成后,提取中间层激活值作为图像表示;采集描述中的每个词由一个在语料库上完成训练的word2vec映射为词向量,所有词向量经池化后得到文本表示;图像及文本表示两种模态的表示一同输入到一个完成训练的多模态深度玻尔兹曼机中,推断的顶层激活概率将作为采集的多模态联合表示;本发明将图片、文本两种不同模态的数据融合形成了统一的表示空间,并合理地处理了缺失值问题,是十分有效的采集多模态联合表示方法。

Patent Agency Ranking