手写内容编辑设备和方法

    公开(公告)号:CN107967105A

    公开(公告)日:2018-04-27

    申请号:CN201610911313.1

    申请日:2016-10-19

    Inventor: 乐宁 吴亚栋

    Abstract: 本发明涉及手写内容编辑设备和方法。该方法包括:输入由笔划组成的手写内容;对笔划进行采样,获得笔划的轨迹点,检测手写内容的方向并将手写内容划分为文本行或文本列;显示手写内容;以及按照笔划顺序存储笔划以及划分结果;其中,通过以下操作,将手写内容划分为文本行或文本列:在输入新的行/列的笔划时,确定前一行/列的所有笔划的中心以及该行/列的所有笔划的X坐标偏差以及Y坐标偏差,如果X坐标偏差大于Y坐标偏差,则确定前一行/列是文本行;否则,前一行/列是文本列。根据本发明实施例的手写内容编辑设备和方法,能够以更高精度划分水平行和垂直列,且以更高精度划分手写字符。

    文档图像处理装置及文档图像处理方法

    公开(公告)号:CN101493896B

    公开(公告)日:2013-02-06

    申请号:CN200810000249.7

    申请日:2008-01-24

    Abstract: 抽取出文档图像中字符数为M的字符串,将其1个字符1个字符地分割,抽出各字符图像的图像特征,根据该图像特征,利用以1个字符为单位储存字符图像的图像特征的字形特征字典15,按照匹配度从高到低的顺序选择N个(N>1的整数)字符图像作为候选字符,创建抽取出的字符串的字符数M×N维的第1索引矩阵。从创建的第1索引矩阵作成字符组合,根据基于概念词典的意义解析,抽出主题词。抽出的主题词按照基于规定的权重信息、统计信息决定的顺序进行一览显示。

    检测语音关键词的方法和设备及检索方法和系统

    公开(公告)号:CN101593519B

    公开(公告)日:2012-09-19

    申请号:CN200810099976.3

    申请日:2008-05-29

    Abstract: 公开了一种检测语音关键词的方法和设备以及相应的检索方法和系统,该设备包括:VQ码本库,存储了基于预定声学模型的VQ码本;状态特征库,存储了该音频文件的VQ状态序列矩阵,该矩阵包括该音频文件的各个语音帧的VQ码本编号和相应的声学概率值;状态序列生成单元,基于VQ码本库中的VQ码本,将输入的关键词转换成相应的VQ状态序列;以及匹配单元,利用转换的VQ状态序列对状态特征库中的VQ状态序列矩阵进行缩减,并用该VQ状态序列在经缩减的矩阵中搜索该语音关键词。利用本发明的技术,能够从音频文件中快速检测到语音关键词,以及从音频文件库中快速找到含有该关键词的音频文件。

    文档图像处理装置和文档图像处理方法

    公开(公告)号:CN101354705B

    公开(公告)日:2012-06-13

    申请号:CN200710129608.4

    申请日:2007-07-23

    CPC classification number: G06F17/30253 G06F17/30017

    Abstract: 本发明提供一种可减少从文档图像中检索出所希望的标题所需的时间和劳力的文档图像处理装置。其中,由标题区域抽出部(301)检索索引信息DB(17),并抽出包含检索关键词的标题区域。顺序设定部(302)对由标题区域抽出部(301)抽出的标题区域,按照预定的规则来自动地设定顺序。显示部(303)中,显示文档图像,而且在所显示的文档图像上,按照由顺序设定部(302)设定的顺序,来强调显示由标题区域抽出部(301)抽出的标题区域。也可以基于抽出的标题关键词的个数及文字图像的特征来判断重要性,并设定所显示的检索结果的顺序。

    图像辨别装置及图像检索装置

    公开(公告)号:CN101567048B

    公开(公告)日:2012-06-06

    申请号:CN200810090491.8

    申请日:2008-04-21

    CPC classification number: G06K9/54 G06K9/346 G06K9/522

    Abstract: 本发明提供能够降低辨别处理所需的运算量且能够提高辨别精度的图像辨别装置及具备该装置的图像检索装置。其中,预处理部(120)对所输入的图像数据进行二值化并算出全体黑像素比例。在特征抽出部(121)中,检测出二值图像数据中包含的连通区域,检测出外接于该连通区域的外接矩形。对检测出的外接矩形,基于外接矩形的大小及所包含的黑像素数,从所有连通区域中去除规定的连通区域。辨别部(122)利用剩余的连通区域生成边缘图,并进行二维快速傅立叶变换而生成频谱数据。另一方面,也对模板图像进行二维快速傅立叶变换而生成频谱数据,并基于这些频谱数据来辨别输入图像数据中是否包含圆形状。

    摘要生成装置和摘要生成方法

    公开(公告)号:CN102479196A

    公开(公告)日:2012-05-30

    申请号:CN201010560580.1

    申请日:2010-11-23

    Inventor: 乐宁 吴波 吴亚栋

    Abstract: 本发明目的是提供摘要生成装置和摘要生成方法,通过考虑具有多个词义的单词而能够生成适当的摘要。在摘要生成装置(100)中设有:存储文章数据的文章数据存储部(10);对由文章数据表示的文章中的多个单词,基于该文章数据统计各单词的词频,当文章中的单词具有多个词义时,按照每个词义作为不同的副单词处理,统计与各副单词对应的词频的词频统计部(20);基于文章数据和表示文章中的单词和副单词中词频最高者的数据来选择文章中的多个句子,从而生成摘要数据的句子选择部(30)。

    输入装置
    7.
    发明公开

    公开(公告)号:CN101424973A

    公开(公告)日:2009-05-06

    申请号:CN200710166100.1

    申请日:2007-11-02

    Abstract: 本发明的目的在于提供这样的输入装置,其能够容易且迅速地输入各种信息。手写字符输入单元(11)中,从作为手写字符输入部(14)的触摸屏(10)手写输入字符,该字符由起手写字符识别部(15)作用的控制部(7)来识别。语音指令输入单元(12)中,从作为语音指令输入部(16)的语音输入部(4)语音输入指令,该指令由起语音指令识别部(17)作用的控制部(7)来识别。还起选择单元(13)作用的控制部(7)选择性地使手写字符输入单元(11)及语音指令输入单元(12)动作。

    信息处理装置、信息处理系统和信息处理方法

    公开(公告)号:CN101276412A

    公开(公告)日:2008-10-01

    申请号:CN200710090671.1

    申请日:2007-03-30

    CPC classification number: G06K9/033 G06K9/00456

    Abstract: 一种信息处理装置具有:特征抽出部,其从印刷有具有记入栏的多个项目的处理对象文件的图像数据中,作为样式信息抽出处理对象文件的样式的特征;表识别部,其将处理对象文件的样式信息,与存储在存储装置中的关于多个登记文件的样式的特征即样式信息进行比较,并特定与处理对象文件相对应的登记文件;数据取得部,其将处理对象文件的图像数据中的文字转换成文本数据;数据分割部,其将处理对象文件的各个项目中的记入栏的文字的图像数据和文本数据,根据每个登记文件的分割规则,按每个项目分成多个组,并将每个这些组发送给不同的作业用终端装置。由此,在处理个人信息等保护对象信息时,可防止使用保护对象信息的作业人员以完整的状态获得保护对象信息。

    对数据进行聚类的方法、设备和系统

    公开(公告)号:CN101833553B

    公开(公告)日:2013-09-11

    申请号:CN200910126215.7

    申请日:2009-03-09

    Abstract: 本发明公开了一种对数据进行聚类的方法、设备和系统。首先创建分级生成树,然后进行迭代图缩减和约束图切分;并且最后实现了分级式分割。通过分割的子图来获得聚类结果。本发明的计算成本低,处理速度快,聚类精度高,并且鲁棒性强。聚类的结果具有较好的统计特征。本发明可以用于各种数据分类系统。

    文字图像抽出装置及文字图像抽出方法

    公开(公告)号:CN101354746B

    公开(公告)日:2011-08-31

    申请号:CN200710129605.0

    申请日:2007-07-23

    CPC classification number: G06K9/34 G06K9/342 G06K9/348 G06K2209/01

    Abstract: 本发明提供一种文字图像抽出方法及文字图像抽出装置。在抽出步骤中,通过抽出部(401),对排列两个或两个以上文字的文字列区域,求出由相互连接的两个或两个以上像素构成的连接成分,并从其中抽出由与连接成分外接的外接图形划分的划分要素。在改变步骤中,通过第一改变部(402),在上述抽出的划分要素中,将至少一部分相互重合的划分要素进行综合而作为新的划分要素。在下面的第一选择步骤中,通过第一选择部(403),预先确定基准大小,在第一改变步骤中改变的划分要素中,选择比上述基准大小还大的划分要素。之后,可以按该顺序执行第二改变步骤及第二选择步骤。由此,可以从排列两个或两个以上文字的文字列区域中高精度地抽出各文字的图像。

Patent Agency Ranking