语料库制作装置及其方法

    公开(公告)号:CN1916889B

    公开(公告)日:2011-02-02

    申请号:CN200510093228.0

    申请日:2005-08-19

    IPC分类号: G06F17/27 G06F17/30

    摘要: 本发明提供一种语料库的制作装置及其制作方法,该装置除了包括单词抽出部、出现频率计算部、关联度计算部、语料库制作部之外,还包括包含关系制作部,该包含关系制作部基于单词之间的语义,对单词抽出部得到的单词用树形结构建立纵向包含关系结构。根据本发明的语料库制作装置及其制作方法所得到的语料库同时具有单词间的纵向包含关系结构、相关网络、相似网络,因此,使用根据本发明制作的语料库不仅可以对各种信息进行有机的组织,而且更加便于根据用户的要求对信息进行分类,在海量的数据中找到个人感兴趣的信息。

    语料库制作装置及其方法

    公开(公告)号:CN1916889A

    公开(公告)日:2007-02-21

    申请号:CN200510093228.0

    申请日:2005-08-19

    IPC分类号: G06F17/27 G06F17/30

    摘要: 本发明提供一种语料库的制作装置及其制作方法,该装置除了包括单词抽出部、出现频率计算部、关联度计算部、语料库制作部之外,还包括包含关系制作部,该包含关系制作部基于单词之间的语义,对单词抽出部得到的单词用树形结构建立纵向包含关系结构。根据本发明的语料库制作装置及其制作方法所得到的语料库同时具有单词间的纵向包含关系结构、相关网络、相似网络,因此,使用根据本发明制作的语料库不仅可以对各种信息进行有机的组织,而且更加便于根据用户的要求对信息进行分类,在海量的数据中找到个人感兴趣的信息。