发明授权
- 专利标题: 一种实时知识图谱构建系统
-
申请号: CN201910642692.2申请日: 2019-07-16
-
公开(公告)号: CN110377757B公开(公告)日: 2023-02-14
- 发明人: 杨仪军
- 申请人: 北京海致星图科技有限公司
- 申请人地址: 北京市海淀区学院路甲5号2幢平房B-1031室
- 专利权人: 北京海致星图科技有限公司
- 当前专利权人: 北京海致星图科技有限公司
- 当前专利权人地址: 北京市海淀区学院路甲5号2幢平房B-1031室
- 代理机构: 深圳市恒和大知识产权代理有限公司
- 代理商 孟庆茹
- 主分类号: G06F16/36
- IPC分类号: G06F16/36
摘要:
本发明公开了一种实时知识图谱构建系统,涉及图分析平台技术领域。该实时知识图谱构建系统,包括应用程序部分、知识存储模块、知识消费模块、知识总线、数据源总线和数据源模块;其中每个部分的具体工作如下:A1、数据源模块负责数据采集并接入KAFKA消息队列;B1、源数据总线负责传输需要提取实体/关系的基础数据;C1、知识提取模块负责用SparkStreaming消费KAFKA中的基础数据进行实体提取、关系提取。该实时知识图谱构建系统,通过应用程序部分、知识存储模块、数据源总线和数据源模块等模块的配合使用,使用Spark Streaming消费KAFKA中的基础数据进行实体提取、关系提取,将失败数据采用HBase记录在外部存储内,同时可以解决提取数据丢失或者重复以及数据源接入单一的问题。
公开/授权文献
- CN110377757A 一种实时知识图谱构建系统 公开/授权日:2019-10-25