一种视频分类方法、装置及设备、存储介质

    公开(公告)号:CN111259919B

    公开(公告)日:2024-01-23

    申请号:CN201811457704.6

    申请日:2018-11-30

    Abstract: 达,有利于提高视频分类准确度。本发明提供一种视频分类方法、装置及设备、存储介质,视频分类方法,包括:将待分类处理的视频帧序列输入至已训练的神经网络中,以由所述神经网络对所述视频帧序列中每N个视频帧在目标域上进行特征关联得到对应的第一关联特征向量,对所有第一关联特征向量在时间域上进行特征关联得到第二关联特征向量,并对所述第二关联特征向量进行分类得到并输出分类结果;依据所述神经网络输出的分类结果确定所述视频帧序列的类别;其中,所述N为小于所述视(56)对比文件智洪欣;于洪涛;李邵梅.基于时空域深度特征两级编码融合的视频分类.计算机应用研究.2017,(第03期),全文.吴庆甜;郭会文;吴新宇;贺涛.基于巡逻机器人的实时跑动检测系统.集成技术.2017,(第03期),浦世亮;程战战.基于注意力矫正的自然场景文字识别.中国公共安全.2017,(第09期),

    一种车牌识别方法、装置及电子设备

    公开(公告)号:CN111027555B

    公开(公告)日:2023-09-26

    申请号:CN201811174638.1

    申请日:2018-10-09

    Inventor: 钱华 程战战

    Abstract: 本申请提供一种车牌识别方法、装置及电子设备,包括:依据目标车牌区域中目标车牌的各车牌特征确定目标车牌特征序列,所述车牌特征是卷积神经网络从包含目标车牌的图像中提取的车牌属性特征;将所述目标车牌特征序列输入至注意力模型,以由所述注意力模型按照以编辑距离作为损失函数训练出的模型参数对该目标车牌特征序列进行字符串识别,并输出所述目标车牌的车牌号;获取所述注意力模型输出的所述目标车牌的车牌号。使用本申请提供的方法可以提高车牌识别的准确性。

    一种事件检测方法、装置和计算机设备

    公开(公告)号:CN111832351A

    公开(公告)日:2020-10-27

    申请号:CN201910312414.0

    申请日:2019-04-18

    Abstract: 本申请提供一种事件检测方法、装置和计算机设备。本申请提供的事件检测方法,包括:将待检测视频切分为多个子视频;对每个子视频进行特征提取,得到每个子视频的特征图;针对每个子视频,将该子视频输入到第一神经网络,输出该子视频的权重;其中,每个子视频的权重用于表征该子视频与识别出的事件的相关程度;根据每个子视频的特征图和每个子视频的权重,识别所述待检测视频所属的事件,并将权重最大的子视频对应的时间段确定为该事件发生的时间段。本申请提供的事件检测方法、装置和计算机设备,不需要进行逐帧比对,即可确定待检测视频所属的事件和该事件发生的时间段,效率较高。

    一种视频分类方法、装置及设备、存储介质

    公开(公告)号:CN111259919A

    公开(公告)日:2020-06-09

    申请号:CN201811457704.6

    申请日:2018-11-30

    Abstract: 本发明提供一种视频分类方法、装置及设备、存储介质,视频分类方法,包括:将待分类处理的视频帧序列输入至已训练的神经网络中,以由所述神经网络对所述视频帧序列中每N个视频帧在目标域上进行特征关联得到对应的第一关联特征向量,对所有第一关联特征向量在时间域上进行特征关联得到第二关联特征向量,并对所述第二关联特征向量进行分类得到并输出分类结果;依据所述神经网络输出的分类结果确定所述视频帧序列的类别;其中,所述N为小于所述视频帧序列长度的正整数,所述目标域至少包括空间域。改善对视频在时间域和空间域上的信息表达,有利于提高视频分类准确度。

    一种视频内容识别方法、装置及电子设备

    公开(公告)号:CN109409165A

    公开(公告)日:2019-03-01

    申请号:CN201710697177.5

    申请日:2017-08-15

    Abstract: 本发明实施例提供了一种视频内容识别方法、装置及电子设备,所述方法包括:确定待识别的目标视频帧序列;获得所述目标视频帧序列中各个视频帧的目标图像特征;基于预先构建的注意力模型,确定所获得的各个目标图像特征所对应的目标权重值,其中,所述注意力模型为:以存在异常事件的视频帧序列样本所对应的各个图像特征为输入内容,以所述各个图像特征对应的权重值为输出内容训练所得到的,其中,在所述视频帧序列样本中,异常帧的图像特征的权重值高于其他帧的权重值;基于所述各个目标图像特征所对应的目标权重值,确定所述目标视频帧序列中是否存在异常事件。应用本发明实施例,可以降低识别视频内容的成本,并可以提高识别效率。

    文档图像的文档版面分析方法、装置及存储介质

    公开(公告)号:CN110969056B

    公开(公告)日:2023-08-08

    申请号:CN201811152315.2

    申请日:2018-09-29

    Inventor: 程战战

    Abstract: 本发明是关于一种文档图像的文档版面分析方法、装置及存储介质,涉及图像处理技术领域。在本发明实施例中,获取文档图像中待分析的文档版面,由于提取了该文档版面中的至少一个文字区块,并对该至少一个文字区块进行文字识别,得到至少一个文字区块对应的文字信息,因此,可以根据该至少一个文字区块对应的文字信息,确定该至少一个文字区块对应的至少一个主题信息,进而根据该至少一个主题信息,确定该文档版面的描述信息。如此,当用户在查阅文档版面时,可以根据该文档版面的描述信息快速获知该文档版面所表达的含义,提高了查阅文档版面的效率。

    一种文字识别的方法、装置及电子设备

    公开(公告)号:CN110659641B

    公开(公告)日:2023-05-26

    申请号:CN201810691282.2

    申请日:2018-06-28

    Abstract: 本申请提供一种文字识别的方法、装置及电子设备,所述方法包括:从目标文字图片中提取特征图;对所述特征图进行滑窗处理,得到时空特征序列;将所述时空特征序列输入到预先训练的时空注意力模型,以由所述时空注意力模型对所述时空特征序列编码处理得到时空语义编码,并对所述时空语义编码解码输出识别出的所述目标文字图片中的文字信息。本申请技术方案,可以基于目标文字图片的两个维度的信息识别目标文字图片包含的文字信息,有效提高了识别率。

    一种事件检测方法、装置及电子设备

    公开(公告)号:CN110533053B

    公开(公告)日:2022-12-06

    申请号:CN201810502656.1

    申请日:2018-05-23

    Abstract: 本发明实施例提供了一种事件检测方法、装置及电子设备,其中,事件检测方法包括:从待检测的多媒体流中,提取多媒体帧序列;对多媒体帧序列进行光流分析,得到多媒体帧序列中各多媒体帧对应的光流图;将各多媒体帧与对应的光流图进行融合,并通过预先训练得到的卷积神经网络,对融合后得到的图像序列进行运算,得到携带有时序信息的空间特征图序列;通过预先训练得到的时空循环神经网络,按照时序信息,对空间特征图序列进行递归运算,得到时空特征图序列;基于时空特征图序列,利用预设多分类器,确定多媒体流中的事件类型。通过本方案,可以实现对通用事件的检测。

    文本检测方法、装置、电子设备和存储介质

    公开(公告)号:CN110717486B

    公开(公告)日:2022-08-05

    申请号:CN201810769512.2

    申请日:2018-07-13

    Abstract: 本申请公开了一种文本检测方法、装置、电子设备和存储介质,属于图像检测技术领域。所述方法包括:基于待检测的目标图像,确定所述目标图像对应的特征图像,并基于所述特征图像中确定所述特征图像中的每个像素点的形变特征;根据所述特征图像中的每个像素点的形变特征,获取所述特征图像中的每个像素点的形变参数;根据所述特征图像中的每个像素点的形变参数,从所述特征图像中确定文本区域。本申请中由于结合了像素点的形变特征对特征图像进行检测,从而能够检测任一形变文本,进而提高了检测准确性。

    图像目标的识别方法及装置

    公开(公告)号:CN108664848A

    公开(公告)日:2018-10-16

    申请号:CN201710200804.X

    申请日:2017-03-30

    Inventor: 程战战

    Abstract: 本发明实施例提供了一种图像目标的识别方法及装置,所述方法包括:获取待识别图像;将所述待识别图像输入预设的三维分类模型;所述三维分类模型提取所述待识别图像的三维图像特征,并根据所述三维图像特征,生成所述待识别图像的三维概率空间图,根据预存的各种目标物与三维概率空间图之间的关系,识别所述待识别图像中的目标物,并将所述目标物作为识别结果输出;获取所述三维分类模型输出的识别结果。应用本发明实施例能够提高图像目标识别的准确率。

Patent Agency Ranking