-
公开(公告)号:CN108959370B
公开(公告)日:2021-04-06
申请号:CN201810498426.2
申请日:2018-05-23
Applicant: 哈尔滨工业大学
Abstract: 本发明涉及数据处理技术领域,提供了一种基于知识图谱中实体相似度的社区发现方法及装置,该方法包括:使用知识图谱存储社交网络数据,并计算杰卡德距离得到相似度矩阵;根据所述相似度矩阵计算所述知识图谱中的相似节点集合;根据所述相似节点集合进行迭代的标签传播,并根据迭代后的每个节点的标签列表来确定该节点最终的社区标签,以进行社区发现。我们利用知识图谱存储社区网络,避免了对缺失数据的结构的存储,同时以此为基础将杰卡德距离作为相似度的计算基准,使其准确度更高。
-
公开(公告)号:CN109086356A
公开(公告)日:2018-12-25
申请号:CN201810787761.4
申请日:2018-07-18
Applicant: 哈尔滨工业大学
IPC: G06F17/30
Abstract: 本发明提供了一种大规模知识图谱的错误连接关系诊断及修正方法,其中诊断方法包括:构建知识图谱的层次结构,确定知识图谱中每个节点所处的层级;基于所述知识图谱的层次结构,提取节点的连接关系集合,所述连接关系集合中包含指向自己的所有IsA关系;判断同一层级上节点之间的关系;对于同一层级上被判定为相矛盾含义的节点对,诊断为其中包括错误连接关系,并继续对其上级进行搜索。本发明在不引入其它外源知识的情况下,利用知识图谱本身知识之间的关系,对具有IsA关系的图谱实现错误连接关系的检测并修正。
-
公开(公告)号:CN109033314A
公开(公告)日:2018-12-18
申请号:CN201810787762.9
申请日:2018-07-18
Applicant: 哈尔滨工业大学
Abstract: 本发明涉及数据处理技术领域,提供了一种内存受限情况下的大规模知识图谱的实时查询方法及系统,该方法包括:对原始知识图谱进行处理分析得到倒排文件哈希列表;基于原始知识图谱构建多级结构索引;对查询语句进行解析得到目标词汇,并根据所述倒排文件哈希列表和多级结构索引查找该目标词汇对应的三元组生成结果子图。本发明大大的提高了单机知识图谱查询能力,能够在内存极度受限的情况下给出既满足用户时间需求又满足用户精度需求的结果集。
-
公开(公告)号:CN108959370A
公开(公告)日:2018-12-07
申请号:CN201810498426.2
申请日:2018-05-23
Applicant: 哈尔滨工业大学
CPC classification number: G06Q50/01
Abstract: 本发明涉及数据处理技术领域,提供了一种基于知识图谱中实体相似度的社区发现方法及装置,该方法包括:使用知识图谱存储社交网络数据,并计算杰卡德距离得到相似度矩阵;根据所述相似度矩阵计算所述知识图谱中的相似节点集合;根据所述相似节点集合进行迭代的标签传播,并根据迭代后的每个节点的标签列表来确定该节点最终的社区标签,以进行社区发现。我们利用知识图谱存储社区网络,避免了对缺失数据的结构的存储,同时以此为基础将杰卡德距离作为相似度的计算基准,使其准确度更高。
-
-
-