-
公开(公告)号:CN107145883A
公开(公告)日:2017-09-08
申请号:CN201610115229.9
申请日:2016-03-01
Applicant: 夏普株式会社
CPC classification number: G06K9/20 , G06K9/2063 , G06K9/38 , G06K9/4609
Abstract: 本发明涉及文本检测方法和设备,能够支持多语言,且能够以高精度识别文本。根据本发明的文本检测方法包括:对待检测的图像进行二值化,以得到二值化图像并提取连通域,得到连通域的特征;对提取的连通域进行组合,以检测水平行和垂直行;以及针对检测到的结果进行滤波,以消除噪声。
-
公开(公告)号:CN102375984B
公开(公告)日:2014-02-26
申请号:CN201010250460.1
申请日:2010-08-06
Applicant: 夏普株式会社
Abstract: 本发明提供能够与对比度无关地计算出对图像的旋转鲁棒性强的特征量的特征量计算装置、图像连接装置、图像检索装置及特征量计算方法。作为特征量计算装置,设置有:计算相角量的相角量计算部;检测特征点的特征点检测部;计算特征点附近的支配性取向的支配性取向计算部;检出以特征点为中心的p个圆的圆周上的像素数据的同心圆检测部;分别计算出对圆周上的各像素数据中的像素值的梯度的角度与支配性梯度的差量值,乘以了圆的半径的平方根而得到的权重差量值的权重差量值计算部;生成具有关于权重差量值的q个级别的度数分布的度数分布生成部;和根据以p个圆各自的各度数作为成分的q维向量,计算出p×q维描述符向量的描述符向量计算部。
-
公开(公告)号:CN101226595B
公开(公告)日:2012-05-23
申请号:CN200710000960.8
申请日:2007-01-15
Applicant: 夏普株式会社
CPC classification number: G06K9/6828 , G06F17/30253
Abstract: 本发明的文档图像处理装置,抽取出文档图像中的标题区域的图像,将其按单个文字进行分割,并抽出各文字图像的图像特征,基于该图像特征,从以单个文字为单位储存有文字图像的图像特征的字形特征字典中,按照匹配度从高到低的顺序,选择出N个文字图像作为候补文字,其中N为N>1的整数,并制作成抽取出的文字列的文字数M×N维索引矩阵。然后,基于所制作出的索引矩阵,制作出反映了文档图像内容的有意义的文档名,并对所存储的文档图像进行管理。由此,可以提供一种不用麻烦用户的手,就可自动制作反映了文档图像内容的有意义的文档名并进行管理的文档图像处理装置及方法。
-
公开(公告)号:CN101944091A
公开(公告)日:2011-01-12
申请号:CN200910140212.9
申请日:2009-07-07
Applicant: 夏普株式会社
Abstract: 本发明的目的在于,提供一种能够将检索处理涉及的处理速度高速化、提高文档图像数据的检索精度的图像检索装置。步骤A1中,前处理部(130)作为对被输入的图像数据的前处理实施二值化处理。步骤A2中,基于被二值化后的图像数据,特征提取部(131)提取二值化图像数据的特征量。步骤A3中,检索部(132)比较登记图像数据的特征量和二值化数据的特征量,并从登记图像数据当中检索与输入图像数据类似度高的图像数据。步骤A4中,将检索结果向显示部(14)输出。这里,特征量是将相邻接的2个单词的单词长度的比fn按照单词的排列顺序排列后的数组。
-
公开(公告)号:CN101493896A
公开(公告)日:2009-07-29
申请号:CN200810000249.7
申请日:2008-01-24
Applicant: 夏普株式会社
Abstract: 抽取出文档图像中字符数为M的字符串,将其1个字符1个字符地分割,抽出各字符图像的图像特征,根据该图像特征,利用以1个字符为单位储存字符图像的图像特征的字形特征字典15,按照匹配度从高到低的顺序选择N个(N>1的整数)字符图像作为候选字符,创建抽取出的字符串的字符数M×N维的第1索引矩阵。从创建的第1索引矩阵作成字符组合,根据基于概念词典的意义解析,抽出主题词。抽出的主题词按照基于规定的权重信息、统计信息决定的顺序进行一览显示。
-
公开(公告)号:CN106293185A
公开(公告)日:2017-01-04
申请号:CN201510305645.0
申请日:2015-06-05
Applicant: 夏普株式会社
CPC classification number: G06F3/041
Abstract: 本发明涉及手写表识别方法和设备。该方法包括:检测表格线;确定相交的最长的垂直表格线和最长的水平表格线;计算恰好覆盖所有表格线的边界矩形;针对每个表格线,在边界矩形上延伸,得到对应的虚拟表格线;计算由虚拟表格线和表格线划分的框的中心点的位置;将各个中心点分为内部点和外部点,其中内部点是由表格线包围的中心点;将内部点分组,如果相邻内部点之间的路径未被表格线所阻挡,则所述内部点属于相同的组;将属于相同组的内部点所对应的框组合,形成为单元格;以及识别各个单元格内的手写内容。根据本发明实施例的手写表识别方法和设备,能够高效且高精确地对手写表进行识别。
-
公开(公告)号:CN105630368A
公开(公告)日:2016-06-01
申请号:CN201410608682.4
申请日:2014-11-03
Applicant: 夏普株式会社
IPC: G06F3/0488 , G06F3/041
CPC classification number: G06K9/34
Abstract: 本发明涉及手写内容划分方法和设备。该方法包括:对新输入的笔画进行采样,计算覆盖新输入的笔画的新笔画区域,如果新笔画区域与一个行输入区域相交,则将新输入的笔画划分为属于与所述行输入区域相对应的行,并重新计算所述行的行边界区域和行输入区域;如果新笔画区域与任意行输入区域都不相交,则认为新输入的笔画属于新的一行,将所述新笔画区域当做该新的一行的行边界区域,并根据预定规则计算该新的一行的行输入区域,其中,所述行输入区域覆盖行边界区域。根据本发明实施例的手写内容划分方法和设备,能够高效且高精确地对手写内容进行划分。
-
公开(公告)号:CN103634495A
公开(公告)日:2014-03-12
申请号:CN201210298886.3
申请日:2012-08-21
Applicant: 夏普株式会社
Abstract: 公开了一种对文档进行复印的方法和设备。方法包括步骤:扫描文档的页面;在页面的扫描图像中检测对页面的至少一个区域加以指示的标记;如果在扫描图像中检测到标记,则根据检测到的标记,在扫描图像中指定至少一个图像区域;以及对指定的图像区域进行成像。根据本发明实施例,实现了基于标记的区域复印方法,能够自动识别用户标记的区域来进行复印,更加直观、灵活和方便,并且确保了信息安全性。
-
公开(公告)号:CN102375984A
公开(公告)日:2012-03-14
申请号:CN201010250460.1
申请日:2010-08-06
Applicant: 夏普株式会社
Abstract: 本发明提供能够与对比度无关地计算出对图像的旋转鲁棒性强的特征量的特征量计算装置、图像连接装置、图像检索装置及特征量计算方法。作为特征量计算装置,设置有:计算相角量的相角量计算部;检测特征点的特征点检测部;计算特征点附近的支配性取向的支配性取向计算部;检出以特征点为中心的p个圆的圆周上的像素数据的同心圆检测部;分别计算出对圆周上的各像素数据中的像素值的梯度的角度与支配性梯度的差量值,乘以了圆的半径的平方根而得到的权重差量值的权重差量值计算部;生成具有关于权重差量值的q个级别的度数分布的度数分布生成部;和根据以p个圆各自的各度数作为成分的q维向量,计算出p×q维描述符向量的描述符向量计算部。
-
公开(公告)号:CN101354746B
公开(公告)日:2011-08-31
申请号:CN200710129605.0
申请日:2007-07-23
Applicant: 夏普株式会社
CPC classification number: G06K9/34 , G06K9/342 , G06K9/348 , G06K2209/01
Abstract: 本发明提供一种文字图像抽出方法及文字图像抽出装置。在抽出步骤中,通过抽出部(401),对排列两个或两个以上文字的文字列区域,求出由相互连接的两个或两个以上像素构成的连接成分,并从其中抽出由与连接成分外接的外接图形划分的划分要素。在改变步骤中,通过第一改变部(402),在上述抽出的划分要素中,将至少一部分相互重合的划分要素进行综合而作为新的划分要素。在下面的第一选择步骤中,通过第一选择部(403),预先确定基准大小,在第一改变步骤中改变的划分要素中,选择比上述基准大小还大的划分要素。之后,可以按该顺序执行第二改变步骤及第二选择步骤。由此,可以从排列两个或两个以上文字的文字列区域中高精度地抽出各文字的图像。
-
-
-
-
-
-
-
-
-