一种视频分类方法及系统

    公开(公告)号:CN108615043A

    公开(公告)日:2018-10-02

    申请号:CN201611137674.1

    申请日:2016-12-12

    CPC classification number: G06K9/6267 G06K9/6212

    Abstract: 本发明实施例公开了一种视频分类方法及系统,所述方法包括:所述系统从输入视频中获取至少一个视频分段;所述系统根据各视频分段中的距离特性,获取各视频分段对应的关键帧;所述系统对各关键帧进行图像分类,获取各关键帧对应的静态分类集合;所述系统根据各视频分段对应的关键帧、各关键帧对应的静态分类集合及预设视频类别参数,获取所述输入视频的分类结果,采用关键帧进行视频分类解决视频分类准确性差的问题。

    基于合成数据的文本检测方法及装置

    公开(公告)号:CN108108731A

    公开(公告)日:2018-06-01

    申请号:CN201611055485.X

    申请日:2016-11-25

    Abstract: 本发明实施例公开了一种基于合成数据的文本检测方法,包括:对包含有单字图像数据集的正样本与包含有非文本图像数据集的负样本进行深度神经网络训练,得到文本检测的全卷积神经网络模型;利用文本检测的全卷积神经网络模型得到待检测图像的灰度图的概率图并进行阈值二值化,得到二值化概率图;对二值化概率图与待检测图像的灰度图进行图像操作,得到除去非文本背景区域的图像,并在该除去非文本背景区域的图像中提取候选文本框;获取不同尺度下的除去非文本背景区域的待检测图的候选文本框,形成候选文本框集,并利用分类器对其进行过滤,得到最终的文本框;本发明实施例同时还公开了一种基于合成数据的文本检测装置。

    一种视频分类方法及系统

    公开(公告)号:CN108615043B

    公开(公告)日:2021-05-25

    申请号:CN201611137674.1

    申请日:2016-12-12

    Abstract: 本发明实施例公开了一种视频分类方法及系统,所述方法包括:所述系统从输入视频中获取至少一个视频分段;所述系统根据各视频分段中的距离特性,获取各视频分段对应的关键帧;所述系统对各关键帧进行图像分类,获取各关键帧对应的静态分类集合;所述系统根据各视频分段对应的关键帧、各关键帧对应的静态分类集合及预设视频类别参数,获取所述输入视频的分类结果,采用关键帧进行视频分类解决视频分类准确性差的问题。

    基于合成数据的文本检测方法及装置

    公开(公告)号:CN108108731B

    公开(公告)日:2021-02-05

    申请号:CN201611055485.X

    申请日:2016-11-25

    Abstract: 本发明实施例公开了一种基于合成数据的文本检测方法,包括:对包含有单字图像数据集的正样本与包含有非文本图像数据集的负样本进行深度神经网络训练,得到文本检测的全卷积神经网络模型;利用文本检测的全卷积神经网络模型得到待检测图像的灰度图的概率图并进行阈值二值化,得到二值化概率图;对二值化概率图与待检测图像的灰度图进行图像操作,得到除去非文本背景区域的图像,并在该除去非文本背景区域的图像中提取候选文本框;获取不同尺度下的除去非文本背景区域的待检测图的候选文本框,形成候选文本框集,并利用分类器对其进行过滤,得到最终的文本框;本发明实施例同时还公开了一种基于合成数据的文本检测装置。

Patent Agency Ranking