一种面向中医古籍文献的分词方法和装置

    公开(公告)号:CN110134766A

    公开(公告)日:2019-08-16

    申请号:CN201910384880.X

    申请日:2019-05-09

    Abstract: 本发明的实施例公开一种面向中医古籍文献的分词方法和装置,所述方法包括:对中医领域的古籍文献进行预处理,生成训练语言模型的语料;对所述语料进行训练,生成语言模型;使用所述语言模型对所述古籍文献进行无监督分词,生成初步分词结果;根据词性关系、句式的固定搭配以及语言学知识,对所述初步分词结果进行总结,整理出切分规则,形成规则文件;根据所述规则文件中的规则,对所述初步分词结果进行第一次修正,生成第一次修正结果。

    一种面向中医古籍文献的分词方法和装置

    公开(公告)号:CN110134766B

    公开(公告)日:2021-06-25

    申请号:CN201910384880.X

    申请日:2019-05-09

    Abstract: 本发明的实施例公开一种面向中医古籍文献的分词方法和装置,所述方法包括:对中医领域的古籍文献进行预处理,生成训练语言模型的语料;对所述语料进行训练,生成语言模型;使用所述语言模型对所述古籍文献进行无监督分词,生成初步分词结果;根据词性关系、句式的固定搭配以及语言学知识,对所述初步分词结果进行总结,整理出切分规则,形成规则文件;根据所述规则文件中的规则,对所述初步分词结果进行第一次修正,生成第一次修正结果。

Patent Agency Ranking