基于合成数据的文本检测方法及装置

    公开(公告)号:CN108108731A

    公开(公告)日:2018-06-01

    申请号:CN201611055485.X

    申请日:2016-11-25

    Abstract: 本发明实施例公开了一种基于合成数据的文本检测方法,包括:对包含有单字图像数据集的正样本与包含有非文本图像数据集的负样本进行深度神经网络训练,得到文本检测的全卷积神经网络模型;利用文本检测的全卷积神经网络模型得到待检测图像的灰度图的概率图并进行阈值二值化,得到二值化概率图;对二值化概率图与待检测图像的灰度图进行图像操作,得到除去非文本背景区域的图像,并在该除去非文本背景区域的图像中提取候选文本框;获取不同尺度下的除去非文本背景区域的待检测图的候选文本框,形成候选文本框集,并利用分类器对其进行过滤,得到最终的文本框;本发明实施例同时还公开了一种基于合成数据的文本检测装置。

    一种视频分类方法及系统

    公开(公告)号:CN108615043A

    公开(公告)日:2018-10-02

    申请号:CN201611137674.1

    申请日:2016-12-12

    CPC classification number: G06K9/6267 G06K9/6212

    Abstract: 本发明实施例公开了一种视频分类方法及系统,所述方法包括:所述系统从输入视频中获取至少一个视频分段;所述系统根据各视频分段中的距离特性,获取各视频分段对应的关键帧;所述系统对各关键帧进行图像分类,获取各关键帧对应的静态分类集合;所述系统根据各视频分段对应的关键帧、各关键帧对应的静态分类集合及预设视频类别参数,获取所述输入视频的分类结果,采用关键帧进行视频分类解决视频分类准确性差的问题。

    一种基于特征的图像检索方法及装置

    公开(公告)号:CN109697240B

    公开(公告)日:2020-12-22

    申请号:CN201711001272.3

    申请日:2017-10-24

    Inventor: 宋刘一汉

    Abstract: 本发明涉及图像处理和计算机视觉技术领域,特别涉及一种基于特征的图像检索方法及装置。该方法为:对输入的待检索图像进行预处理,并提取经过预处理后的待检索图像的局部特征点和全局特征点;将待检索图像的局部特征点与预设的样本图像索引库中存储的各样本图像分别对应的局部特征点进行比对,得到第一比对结果,并确定出目标样本图像;将待检索图像的全局特征点与样本图像索引库中存储的目标样本图像的全局特征点进行比对,得到第二比对结果;基于第一比对结果和第二比对结果进行图像检索,其中,样本图像索引库中存储有任一样本图像的图像标识与任一样本图像的全部特征点和局部特征点之间的映射关系。

    一种基于特征的图像检索方法及装置

    公开(公告)号:CN109697240A

    公开(公告)日:2019-04-30

    申请号:CN201711001272.3

    申请日:2017-10-24

    Inventor: 宋刘一汉

    Abstract: 本发明涉及图像处理和计算机视觉技术领域,特别涉及一种基于特征的图像检索方法及装置。该方法为:对输入的待检索图像进行预处理,并提取经过预处理后的待检索图像的局部特征点和全局特征点;将待检索图像的局部特征点与预设的样本图像索引库中存储的各样本图像分别对应的局部特征点进行比对,得到第一比对结果,并确定出目标样本图像;将待检索图像的全局特征点与样本图像索引库中存储的目标样本图像的全局特征点进行比对,得到第二比对结果;基于第一比对结果和第二比对结果进行图像检索,其中,样本图像索引库中存储有任一样本图像的图像标识与任一样本图像的全部特征点和局部特征点之间的映射关系。

    一种视频分类方法及系统

    公开(公告)号:CN108615043B

    公开(公告)日:2021-05-25

    申请号:CN201611137674.1

    申请日:2016-12-12

    Abstract: 本发明实施例公开了一种视频分类方法及系统,所述方法包括:所述系统从输入视频中获取至少一个视频分段;所述系统根据各视频分段中的距离特性,获取各视频分段对应的关键帧;所述系统对各关键帧进行图像分类,获取各关键帧对应的静态分类集合;所述系统根据各视频分段对应的关键帧、各关键帧对应的静态分类集合及预设视频类别参数,获取所述输入视频的分类结果,采用关键帧进行视频分类解决视频分类准确性差的问题。

    基于合成数据的文本检测方法及装置

    公开(公告)号:CN108108731B

    公开(公告)日:2021-02-05

    申请号:CN201611055485.X

    申请日:2016-11-25

    Abstract: 本发明实施例公开了一种基于合成数据的文本检测方法,包括:对包含有单字图像数据集的正样本与包含有非文本图像数据集的负样本进行深度神经网络训练,得到文本检测的全卷积神经网络模型;利用文本检测的全卷积神经网络模型得到待检测图像的灰度图的概率图并进行阈值二值化,得到二值化概率图;对二值化概率图与待检测图像的灰度图进行图像操作,得到除去非文本背景区域的图像,并在该除去非文本背景区域的图像中提取候选文本框;获取不同尺度下的除去非文本背景区域的待检测图的候选文本框,形成候选文本框集,并利用分类器对其进行过滤,得到最终的文本框;本发明实施例同时还公开了一种基于合成数据的文本检测装置。

Patent Agency Ranking