-
公开(公告)号:CN108615043A
公开(公告)日:2018-10-02
申请号:CN201611137674.1
申请日:2016-12-12
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团公司
IPC: G06K9/62
CPC classification number: G06K9/6267 , G06K9/6212
Abstract: 本发明实施例公开了一种视频分类方法及系统,所述方法包括:所述系统从输入视频中获取至少一个视频分段;所述系统根据各视频分段中的距离特性,获取各视频分段对应的关键帧;所述系统对各关键帧进行图像分类,获取各关键帧对应的静态分类集合;所述系统根据各视频分段对应的关键帧、各关键帧对应的静态分类集合及预设视频类别参数,获取所述输入视频的分类结果,采用关键帧进行视频分类解决视频分类准确性差的问题。
-
公开(公告)号:CN108108731A
公开(公告)日:2018-06-01
申请号:CN201611055485.X
申请日:2016-11-25
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团公司
Abstract: 本发明实施例公开了一种基于合成数据的文本检测方法,包括:对包含有单字图像数据集的正样本与包含有非文本图像数据集的负样本进行深度神经网络训练,得到文本检测的全卷积神经网络模型;利用文本检测的全卷积神经网络模型得到待检测图像的灰度图的概率图并进行阈值二值化,得到二值化概率图;对二值化概率图与待检测图像的灰度图进行图像操作,得到除去非文本背景区域的图像,并在该除去非文本背景区域的图像中提取候选文本框;获取不同尺度下的除去非文本背景区域的待检测图的候选文本框,形成候选文本框集,并利用分类器对其进行过滤,得到最终的文本框;本发明实施例同时还公开了一种基于合成数据的文本检测装置。
-
公开(公告)号:CN108090400B
公开(公告)日:2021-08-24
申请号:CN201611036897.9
申请日:2016-11-23
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团公司
Abstract: 本发明实施例公开了一种图像文本识别的方法,所述方法包括:构建单行文本图像训练集;利用所述单行文本图像训练集训练预设的神经网络模型,得到单行文本识别模型;利用所述单行文本识别模型识别随机场景的单行文本图像,得到识别后的文本信息。如此,实现了对自然场景单行文本信息的有效识别,降低了人工分割的成本。本发明实施例还公开了一种图像文本识别的装置。
-
公开(公告)号:CN108615043B
公开(公告)日:2021-05-25
申请号:CN201611137674.1
申请日:2016-12-12
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团公司
IPC: G06K9/62
Abstract: 本发明实施例公开了一种视频分类方法及系统,所述方法包括:所述系统从输入视频中获取至少一个视频分段;所述系统根据各视频分段中的距离特性,获取各视频分段对应的关键帧;所述系统对各关键帧进行图像分类,获取各关键帧对应的静态分类集合;所述系统根据各视频分段对应的关键帧、各关键帧对应的静态分类集合及预设视频类别参数,获取所述输入视频的分类结果,采用关键帧进行视频分类解决视频分类准确性差的问题。
-
公开(公告)号:CN108108731B
公开(公告)日:2021-02-05
申请号:CN201611055485.X
申请日:2016-11-25
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团公司
Abstract: 本发明实施例公开了一种基于合成数据的文本检测方法,包括:对包含有单字图像数据集的正样本与包含有非文本图像数据集的负样本进行深度神经网络训练,得到文本检测的全卷积神经网络模型;利用文本检测的全卷积神经网络模型得到待检测图像的灰度图的概率图并进行阈值二值化,得到二值化概率图;对二值化概率图与待检测图像的灰度图进行图像操作,得到除去非文本背景区域的图像,并在该除去非文本背景区域的图像中提取候选文本框;获取不同尺度下的除去非文本背景区域的待检测图的候选文本框,形成候选文本框集,并利用分类器对其进行过滤,得到最终的文本框;本发明实施例同时还公开了一种基于合成数据的文本检测装置。
-
公开(公告)号:CN108090400A
公开(公告)日:2018-05-29
申请号:CN201611036897.9
申请日:2016-11-23
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团公司
CPC classification number: G06K9/00442 , G06K9/6256 , G06N3/084
Abstract: 本发明实施例公开了一种图像文本识别的方法,所述方法包括:构建单行文本图像训练集;利用所述单行文本图像训练集训练预设的神经网络模型,得到单行文本识别模型;利用所述单行文本识别模型识别随机场景的单行文本图像,得到识别后的文本信息。如此,实现了对自然场景单行文本信息的有效识别,降低了人工分割的成本。本发明实施例还公开了一种图像文本识别的装置。
-
-
-
-
-