Patent search ap:("中移(杭州)信息技术有限公司" OR "中国移动通信集团公司") AND inv:"杜安安" Page 1

1.

发明公开
一种视频分类方法及系统有权

公开(公告)号：CN108615043A

公开(公告)日：2018-10-02

申请号：CN201611137674.1

申请日：2016-12-12

Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团公司

Inventor： 宋刘一汉 , 杜安安 , 程耀 , 许宝亮

IPC: G06K9/62

CPC classification number: G06K9/6267 , G06K9/6212

Abstract: 本发明实施例公开了一种视频分类方法及系统，所述方法包括：所述系统从输入视频中获取至少一个视频分段；所述系统根据各视频分段中的距离特性，获取各视频分段对应的关键帧；所述系统对各关键帧进行图像分类，获取各关键帧对应的静态分类集合；所述系统根据各视频分段对应的关键帧、各关键帧对应的静态分类集合及预设视频类别参数，获取所述输入视频的分类结果，采用关键帧进行视频分类解决视频分类准确性差的问题。

2.

发明公开
基于合成数据的文本检测方法及装置有权

公开(公告)号：CN108108731A

公开(公告)日：2018-06-01

申请号：CN201611055485.X

申请日：2016-11-25

Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团公司

Inventor： 杜安安 , 程耀 , 宋刘一汉 , 许宝亮

IPC: G06K9/32 , G06N3/08

Abstract: 本发明实施例公开了一种基于合成数据的文本检测方法，包括：对包含有单字图像数据集的正样本与包含有非文本图像数据集的负样本进行深度神经网络训练，得到文本检测的全卷积神经网络模型；利用文本检测的全卷积神经网络模型得到待检测图像的灰度图的概率图并进行阈值二值化，得到二值化概率图；对二值化概率图与待检测图像的灰度图进行图像操作，得到除去非文本背景区域的图像，并在该除去非文本背景区域的图像中提取候选文本框；获取不同尺度下的除去非文本背景区域的待检测图的候选文本框，形成候选文本框集，并利用分类器对其进行过滤，得到最终的文本框；本发明实施例同时还公开了一种基于合成数据的文本检测装置。

3.

发明授权
一种图像文本识别的方法和装置有权

公开(公告)号：CN108090400B

公开(公告)日：2021-08-24

申请号：CN201611036897.9

申请日：2016-11-23

Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团公司

Inventor： 程耀 , 宋刘一汉 , 杜安安 , 许宝亮

IPC: G06K9/00 , G06K9/62 , G06N3/08

Abstract: 本发明实施例公开了一种图像文本识别的方法，所述方法包括：构建单行文本图像训练集；利用所述单行文本图像训练集训练预设的神经网络模型，得到单行文本识别模型；利用所述单行文本识别模型识别随机场景的单行文本图像，得到识别后的文本信息。如此，实现了对自然场景单行文本信息的有效识别，降低了人工分割的成本。本发明实施例还公开了一种图像文本识别的装置。

4.

发明授权
一种视频分类方法及系统有权

公开(公告)号：CN108615043B

公开(公告)日：2021-05-25

申请号：CN201611137674.1

申请日：2016-12-12

Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团公司

Inventor： 宋刘一汉 , 杜安安 , 程耀 , 许宝亮

IPC: G06K9/62

Abstract: 本发明实施例公开了一种视频分类方法及系统，所述方法包括：所述系统从输入视频中获取至少一个视频分段；所述系统根据各视频分段中的距离特性，获取各视频分段对应的关键帧；所述系统对各关键帧进行图像分类，获取各关键帧对应的静态分类集合；所述系统根据各视频分段对应的关键帧、各关键帧对应的静态分类集合及预设视频类别参数，获取所述输入视频的分类结果，采用关键帧进行视频分类解决视频分类准确性差的问题。

5.

发明授权
基于合成数据的文本检测方法及装置有权

公开(公告)号：CN108108731B

公开(公告)日：2021-02-05

申请号：CN201611055485.X

申请日：2016-11-25

Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团公司

Inventor： 杜安安 , 程耀 , 宋刘一汉 , 许宝亮

IPC: G06K9/32 , G06N3/08

Abstract: 本发明实施例公开了一种基于合成数据的文本检测方法，包括：对包含有单字图像数据集的正样本与包含有非文本图像数据集的负样本进行深度神经网络训练，得到文本检测的全卷积神经网络模型；利用文本检测的全卷积神经网络模型得到待检测图像的灰度图的概率图并进行阈值二值化，得到二值化概率图；对二值化概率图与待检测图像的灰度图进行图像操作，得到除去非文本背景区域的图像，并在该除去非文本背景区域的图像中提取候选文本框；获取不同尺度下的除去非文本背景区域的待检测图的候选文本框，形成候选文本框集，并利用分类器对其进行过滤，得到最终的文本框；本发明实施例同时还公开了一种基于合成数据的文本检测装置。

6.

发明公开
一种图像文本识别的方法和装置有权

公开(公告)号：CN108090400A

公开(公告)日：2018-05-29

申请号：CN201611036897.9

申请日：2016-11-23

Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团公司

Inventor： 程耀 , 宋刘一汉 , 杜安安 , 许宝亮

IPC: G06K9/00 , G06K9/62 , G06N3/08

CPC classification number: G06K9/00442 , G06K9/6256 , G06N3/084

Abstract: 本发明实施例公开了一种图像文本识别的方法，所述方法包括：构建单行文本图像训练集；利用所述单行文本图像训练集训练预设的神经网络模型，得到单行文本识别模型；利用所述单行文本识别模型识别随机场景的单行文本图像，得到识别后的文本信息。如此，实现了对自然场景单行文本信息的有效识别，降低了人工分割的成本。本发明实施例还公开了一种图像文本识别的装置。

Patent Agency Ranking