字典检索装置
    11.
    发明公开

    公开(公告)号:CN1097883A

    公开(公告)日:1995-01-25

    申请号:CN94104998.1

    申请日:1994-04-29

    CPC classification number: G06F17/2795

    Abstract: 本发明为一个字典检索装置,包括:对字符子集提供组ID的转换字符定义表,以组ID替代字符的字符一组ID转换部分、把来自输入部分的输入字符串转换成输入组ID的输入字符串转换部分、将词字典转换成由表示组ID串定义的转换词字典的字典转换部分、以及由输入组ID串检索转换词字典的字典检索部分。该字典检索装置把转换字符定义表所定义的字符集各元素看作为同一元素。

    标注信息生成装置、查询装置及共享系统

    公开(公告)号:CN101551800B

    公开(公告)日:2012-02-15

    申请号:CN200810086799.5

    申请日:2008-03-31

    Abstract: 本发明公开了标注信息生成装置、查询装置及共享系统,所述标注信息生成装置包括标注对象选择单元、标注内容输入单元、网页内元素路径确定单元、标注信息生成单元以及发送单元,标注对象选择单元选择待标注的网页中的待标注的对象,即标注网页对象中的标注对象;标注内容输入单元输入针对所述标注对象的标注,即标注内容;网页内元素路径确定单元确定所述标注对象在所述标注网页对象中的路径,即网页内元素路径;所述标注信息生成单元生成标注信息,所述标注信息包括标注网页对象路径信息、所述标注对象的网页内元素路径、所述标注内容输入单元输入的标注;以及所述发送单元将所述标注信息生成单元生成的标注信息发送到标注信息服务器。

    一种基于语素标注的自然语言成分识别、校正装置及方法

    公开(公告)号:CN1936885A

    公开(公告)日:2007-03-28

    申请号:CN200510103566.8

    申请日:2005-09-21

    Abstract: 本发明为一种基于语素标注的自然语言成分识别、校正装置及方法,包括:输入部,用于输入待分析符号序列;语素学习部,用于生成语素属性,并从待分析自然语言成分的标注样本中学习得到语素与所述语素属性之间的关系规律;语素属性标注部,用于对输入的待分析符号序列进行语素属性标注,生成语素属性标注序列;分析成分合成部,用于从语素属性标注序列中识别出需要的自然语言成分及该自然语言成分的分类标记;输出部,用于输出所述分析成分合成部的识别结果。用以从输入的汉语、日语等自然语言或基因组等符号序列中识别出需要的语言成分或遗传因子等符号组,并标注出识别成分的分类属性。从而解决诸如汉语的未登录词等问题。

    特定类型信息文件的识别方法和装置

    公开(公告)号:CN1702651A

    公开(公告)日:2005-11-30

    申请号:CN200410038357.5

    申请日:2004-05-24

    CPC classification number: G06F17/30896

    Abstract: 提供了一种文件识别装置和方法,用于对从因特网中收集的web页面或存储在其它存储装置中的文件群进行特定信息类型的识别,本发明的装置包括:文件分组部,其按照特定的观点对待识别的文件群进行文件类型分类;文件类型识别部,其根据所述特定信息类型所特有的特征识别文件的类型;以及文件类型识别修正部,其从全组文件识别精度的大局出发,对各个文件识别结果进行修正。本发明的装置和方法可以对各种类型的信息进行识别,并可以实现非常好的识别精度。

    多媒体对象检索设备和方法

    公开(公告)号:CN1581172A

    公开(公告)日:2005-02-16

    申请号:CN200410070553.0

    申请日:2004-08-06

    Abstract: 本发明提供了一种多媒体对象检索设备和方法,用于在同时包含多媒体对象和相关注释文本的结构化文档中检索多媒体对象。本发明的设备和方法对输入的结构化文档进行分析,并将其表示为诸如DOM树那样的某种分析结果;识别所输入的分析结果中的主块,并输出主块标示结构化文档模型;提取多媒体对象和所述注释的配对,并输出诸如XML格式对象索引那样的结构化对象索引;以及在结构化对象索引中进行搜索,并获得目标对象列表。本发明的设备和方法可适用于各种结构化文档,可以更高精度地提取对象注释,可提取内容对象的公共注释,并可标识对象与文档标题间的关系。

    文件处理装置与记录媒体
    16.
    发明公开

    公开(公告)号:CN1286776A

    公开(公告)日:2001-03-07

    申请号:CN98813873.5

    申请日:1998-12-24

    CPC classification number: G06F17/30616 Y10S707/99933

    Abstract: 本发明用于提高文件检索和裁剪精度。其中从文件输入部(1)输入处理对象文件,事件确定装置(4)参考知识信息存储装置(3)中存储的知识信息,确定输入文件中记述的事件的种类,属性值提取装置(5)从文件中提取所确定的事件属性的属性值,相关装置(10)使属性值提取装置(5)所提取的属性值相对于现实中的实体进行相关处理,文件存储装置11将相关装置(10)生成的信息(规范化信息)与确定文件或文件存储地的信息相关联并存储,文件提取装置(2)比较用户接口部(2)输入的查询与规范化信息,从文件存储装置(11)输出确定相应文件或文件存储地的信息。

Patent Agency Ranking