发明授权
- 专利标题: 一种知识图谱构建方法和装置
-
申请号: CN201811098792.5申请日: 2018-09-19
-
公开(公告)号: CN109446337B公开(公告)日: 2020-10-13
- 发明人: 魏凯 , 刘成成 , 姜春宇 , 刘寒 , 闫树 , 马鹏玮 , 王妙琼 , 冯橙 , 卿苏德 , 杨白雪 , 王卓 , 张奕卉 , 张启
- 申请人: 中国信息通信研究院
- 申请人地址: 北京市海淀区花园北路52号
- 专利权人: 中国信息通信研究院
- 当前专利权人: 中国信息通信研究院
- 当前专利权人地址: 北京市海淀区花园北路52号
- 代理机构: 北京德琦知识产权代理有限公司
- 代理商 杜志敏; 宋志强
- 主分类号: G06F16/36
- IPC分类号: G06F16/36
摘要:
本申请提供了一种知识图谱构建方法和装置,该方法包括:获取公安文本数据;将所述公安文本数据进行切词分词形成待处理数据集,并记录每个词在公安文本数据中对应的标题编号;清洗待处理数据集中的形容词、动词、副词和量词;并通过口语语料库和标点符号语料库进行过滤;对过滤后的待处理数据集中的词进行去重;将去重后的待处理数据集中的词作为树节点按照其对应的标题编号建立树型知识图谱。该方法能够节省人工、时间成本,并提高建立知识图谱的效率。
公开/授权文献
- CN109446337A 一种知识图谱构建方法和装置 公开/授权日:2019-03-08