对文档图像进行校正的方法和装置

    公开(公告)号:CN106296745A

    公开(公告)日:2017-01-04

    申请号:CN201510276320.4

    申请日:2015-05-26

    CPC classification number: G06T3/0037 G06T2207/30176

    Abstract: 本发明涉及对文档图像进行校正的方法和装置。该方法包括:输入文档图像及其对应的三维空间上的三维数据点;利用文档图像提取文档图像中的文档页面的边界并估计边界上的三维数据点;对三维空间上的三维数据点进行采样并基于采样的三维数据点构建三维网格;基于三维网格来估计二维网格;以及利用所估计的二维网格对文档图像进行校正。根据本发明的方法和装置,能够重构和展平扭曲的文档图像。

    提取文档边界的方法和装置

    公开(公告)号:CN106295484A

    公开(公告)日:2017-01-04

    申请号:CN201510325050.1

    申请日:2015-06-12

    Inventor: 汪留安 范伟 孙俊

    Abstract: 本发明提供了一种提取文档边界的方法和装置。根据一个实施例的提取文档边界的方法包括:获取基准平面的深度;获取放置在基准平面上的文档的文档图像;获取文档图像的三维点的深度;基于基准平面的深度以及文档图像的三维点的深度在文档图像中提取文档的边界。根据本发明实施例的提取文档边界的方法和装置,可以利用基准平面和文档图像中的三维点的深度在文档图像中提取文档的边界,从而可以降低文档的内容对边界提取的影响。

    全景图像构建装置和方法
    43.
    发明公开

    公开(公告)号:CN105701767A

    公开(公告)日:2016-06-22

    申请号:CN201410709262.5

    申请日:2014-11-28

    Abstract: 本发明涉及一种全景图像构建装置和方法。该全景图像构建装置包括:搜索模块,被配置成在网络上搜索与表示场景信息的关键字相关的图像;提取模块,被配置成提取所述图像的特征;生成模块,被配置成通过根据所述特征将所述图像进行聚类,生成图像簇;及拼接模块,被配置成将所述图像簇进行拼接,以构建全景图像。通过本发明,用于构建全景图像的相关图像的获得将不用人工完成,全景图像的构建不再依赖GPS信息,用户能够构建任意时刻的全景图像,并且全景图像的构建不再局限于地点、风景信息,而是延伸至任意动态场景。

    训练卷积神经网路分类器的方法和图像处理装置

    公开(公告)号:CN105488515A

    公开(公告)日:2016-04-13

    申请号:CN201410474927.9

    申请日:2014-09-17

    Abstract: 本发明提供一种训练卷积神经网路分类器的方法和图像处理装置。根据该训练卷积神经网络分类器的方法,从训练用图像中提取全局特征和局部特征。根据预定模式将全局特征和局部特征映射到特征图以作为分类器的输入样本。根据预定模式,全局特征被映射到至少一个第一区域,局部特征被映射到一个第二区域,每个第一区域与第二区域相接。根据本公开的训练方法,较大程度上提高了检测的速度和准确度。

    图像拼接装置、方法以及图像处理设备

    公开(公告)号:CN104794701A

    公开(公告)日:2015-07-22

    申请号:CN201410027780.9

    申请日:2014-01-21

    Abstract: 本发明实施例提供一种图像拼接装置、方法以及图像处理设备。所述图像拼接方法包括:对第一图像和第二图像进行初始配准,在第一图像的空白区域中获得第一拼接缝;利用第一拼接缝在第二图像的相应区域中进行特征点的匹配,根据匹配的结果在第二图像上获得第二拼接缝;计算第一拼接缝和第二拼接缝之间的距离容差,根据该距离容差来修正第一拼接缝或第二拼接缝;基于第一拼接缝和第二拼接缝进行图像拼接,并对拼接后的原始图像进行补偿以获得拼接后的最终图像。通过本发明实施例,可以进一步提高图像拼接的准确性,获得拼接效果更好的图像。

    基于视觉的手势遥控系统
    46.
    发明公开

    公开(公告)号:CN103376890A

    公开(公告)日:2013-10-30

    申请号:CN201210121832.X

    申请日:2012-04-16

    Inventor: 王琪 范伟 谭志明

    Abstract: 本发明公开了一种基于视觉的手势遥控系统,该基于视觉的手势遥控系统包括:图像捕获设备,用于捕获对象的一系列图像;手势识别设备,用于从图像捕获设备所捕获的一系列图像识别对象的手势并将识别结果发送给操作命令触发设备;以及操作命令触发设备,用于根据从手势识别设备发送来的识别结果来触发预定操作命令。所述手势识别设备包括:手检测部件,用于从图像捕获设备所捕获的图像检测对象的手;手跟踪部件,用于在当手检测部件在一图像中检测到对象的手时,在接下来的图像中跟踪对象的手;手势识别部件,用于根据手检测部件检测到的对象的手和手跟踪部件跟踪到的对象的手来确定对象的手的运动并根据所确定的对象的手的运动来识别对象的手势。

    为数据库确定卷积神经网络CNN模型的装置和方法

    公开(公告)号:CN108133222B

    公开(公告)日:2021-11-02

    申请号:CN201611095599.7

    申请日:2016-12-01

    Abstract: 本发明涉及为数据库确定卷积神经网络CNN模型的装置和方法。根据本发明的为数据库确定CNN模型的装置包括:选取单元,用于从多个已知分类能力的CNN模型中选取至少两个CNN模型;拟合单元,用于根据至少两个CNN模型的分类能力和第一参数拟合以分类能力和第一参数为变量的曲线,其中,第一参数用于表征CNN模型的性能;预测单元,用于根据曲线预测其它CNN模型的第一参数;以及确定单元,用于根据每一个CNN模型的第一参数从多个CNN模型中确定适用于数据库的CNN模型。使用根据本发明的为数据库确定CNN模型的装置和方法,无需对所有CNN模型进行训练,大大降低了计算量,简化了设计CNN模型的流程。

    用于字符识别的分类网络的训练装置、字符识别装置及方法

    公开(公告)号:CN109478229B

    公开(公告)日:2021-08-10

    申请号:CN201680087710.X

    申请日:2016-08-31

    Inventor: 范伟 孙俊

    Abstract: 一种用于字符识别的分类网络的训练装置、字符识别装置及方法。该装置及方法通过对未标记样本构建样本对来训练对称网络,利用经过训练的对称网络的参数对分类网络进行初始化,并利用已标记样本对经过初始化的分类网络进行训练,能够提高分类网络的识别准确率并有效节约标注成本。

    确定输入图像中的矩形目标区域的方法和设备

    公开(公告)号:CN107368829B

    公开(公告)日:2020-08-14

    申请号:CN201610307727.3

    申请日:2016-05-11

    Abstract: 本发明公开了一种确定输入图像中的矩形目标区域的方法和设备。该方法包括:获得输入图像中的水平类线段和竖直类线段;生成候选线段组合,每个候选线段组合中包括两个水平类线段和两个竖直类线段,每个候选线段组合中的线段或其延长线相交得到四个交点;根据每个候选线段组合对应的四个交点、预定参考宽高比、输入图像的相机内参数,计算每个候选线段组合对应的透视校正后矩形区域的宽高比;基于每个候选线段组合对应的宽高比与预定参考宽高比的比较,选择一个候选线段组合;以及将所选择的候选线段组合中的四个线段或其延长线包围的区域确定为矩形目标区域。

    确定卷积神经网络CNN模型的装置和方法

    公开(公告)号:CN108133223B

    公开(公告)日:2020-06-26

    申请号:CN201611095600.6

    申请日:2016-12-01

    Abstract: 本发明涉及确定卷积神经网络CNN模型的装置和方法。根据本发明的确定CNN模型的装置包括:第一确定单元,用于确定包括多个样本的数据库的复杂度;第二确定单元,用于根据数据库的复杂度确定适用于数据库的CNN模型的分类能力;第三确定单元,用于获取多个候选CNN模型中的每个候选CNN模型的分类能力;以及匹配单元,用于根据每个候选CNN模型的分类能力以及适用于数据库的CNN模型的分类能力确定适用于数据库的CNN模型。使用根据本发明的确定CNN模型的装置和方法,可以简化CNN模型的设计流程,使得作为用户的普通人员也能够容易地设计和调整CNN模型,并能够根据数据库的复杂度为该数据库确定出更匹配的CNN模型。

Patent Agency Ranking