-
公开(公告)号:CN101324878A
公开(公告)日:2008-12-17
申请号:CN200710111842.4
申请日:2007-06-15
Applicant: 夏普株式会社
Abstract: 公开了一种适用于包括单词词典的对象语言文字输入系统的新单词自动学习方法,包括:采集步骤,从输入的对象语言语料中采集新单词词典和单词词典中没有的字串作为采集字串,所述新单词词典用于保存所述单词词典中没有的单词;第一保存步骤,将所述采集字串中没有存在于临时新字串词典中的采集字串作为临时新字串保存在临时新字串词典中,以及将存在于所述临时新字串词典中但没有存在于新字串词典中的采集字串作为新字串保存在新字串词典中;以及第二保存步骤,在利用对象语言文字输入系统进行对象语言文字输入过程中用户选择被作为输入候选项呈现的、所述新字串词典中的新字串时,将该新字串作为新单词保存在所述新单词词典中。
-
公开(公告)号:CN101226596A
公开(公告)日:2008-07-23
申请号:CN200710000961.2
申请日:2007-01-15
Applicant: 夏普株式会社
CPC classification number: G06K9/4671 , G06K9/481 , G06K2209/01
Abstract: 本发明的文档图像处理装置,抽取出文档图像中的文字数为M的文字列的图像,将其按单个文字进行分割图像,并抽出各文字图像的图像特征,基于该图像特征,从以单个文字为单位的储存有字库中所有文字图像的图像特征的字形特征字典中,按照匹配度从高到低的顺序,选择出N个文字图像作为候补文字,其中N为N>1的整数,并制作成抽取出的文字列的文字数M×N维索引矩阵。在检索时,以所输入的检索式中的构成检索关键词的单个检索文字为单位,检索索引信息储存部,并取出具有包含检索文字的索引矩阵的文档图像。由此,可提供一种具有不需要用户的手动操作的索引制作功能,且不需要采用OCR识别即可进行高精度检索的文档图像处理装置以及方法。
-