一种知识图谱构建方法和装置
摘要:
本申请提供了一种知识图谱构建方法和装置,该方法包括:获取公安文本数据;将所述公安文本数据进行切词分词形成待处理数据集,并记录每个词在公安文本数据中对应的标题编号;清洗待处理数据集中的形容词、动词、副词和量词;并通过口语语料库和标点符号语料库进行过滤;对过滤后的待处理数据集中的词进行去重;将去重后的待处理数据集中的词作为树节点按照其对应的标题编号建立树型知识图谱。该方法能够节省人工、时间成本,并提高建立知识图谱的效率。
公开/授权文献
0/0