-
公开(公告)号:CN1151456C
公开(公告)日:2004-05-26
申请号:CN99107089.5
申请日:1999-05-27
Applicant: 株式会社日立制作所
CPC classification number: G06F17/3061 , Y10S707/99933 , Y10S707/99935 , Y10S707/99945
Abstract: 本发明提供抽取文书中记述内容的特征的方法以及相似文书检索系统。具有把文本数据库中的文本中存在的文字序列在文本的单词边界所出现的概率存储为出现概率文件的步骤,把文本中文字序列的出现次数存储为出现次数文件的步骤,使用出现概率文件从用户指定的文件抽取特征文字序列的步骤,计数指定文本中的特征文字序列的出现次数的步骤,并且使用出现次数文件和用户指定的文本中的出现次数计数相对于用户指定的文本的相似度。
-
公开(公告)号:CN1237738A
公开(公告)日:1999-12-08
申请号:CN99107089.5
申请日:1999-05-27
Applicant: 株式会社日立制作所
CPC classification number: G06F17/3061 , Y10S707/99933 , Y10S707/99935 , Y10S707/99945
Abstract: 本发明提供抽取文书中记述内容的特征的方法以及相似文书检索系统。具有把文本数据库中的文本中存在的文字序列在文本的单词边界所出现的概率存储为出现概率文件的步骤,把文本中文字序列的出现次数存储为出现次数文件的步骤,使用出现概率文件从用户指定的文件抽取特征文字序列的步骤,计数指定文本中的特征文字序列的出现次数的步骤,并且使用出现次数文件和用户指定的文本中的出现次数计数相对于用户指定的文本的相似度。
-