-
公开(公告)号:CN115292520B
公开(公告)日:2023-02-03
申请号:CN202211187813.7
申请日:2022-09-28
Applicant: 南京邮电大学
IPC: G06F16/36 , G06F40/216 , G06F40/242 , G06F40/289 , G06F40/30 , G06F18/22 , G06N5/02
Abstract: 本发明公开了一种面向多源移动应用知识图谱构建方法,基于获取的来自不同数据源的移动应用数据,生成三元组集合;对实体与关系进行编码,获得对应的向量表示;计算实体向量之间的相似度,将相似度超过设定阈值的向量表示所对应的实体确定为初始语义等价实体对,并确定种子集合;根据元规则从种子集合中推理出潜在语义等价实体对;计算潜在语义等价实体对成立的概率;将计算的概率与设定概率阈值比较,根据比较结果最终确定多源移动应用中实体之间的语义等价关系,进而获得多源移动应用知识图谱。本发明可以显著降低多源数据在知识图谱构建过程中实体语义等价关系的人工标注成本。
-
公开(公告)号:CN115292520A
公开(公告)日:2022-11-04
申请号:CN202211187813.7
申请日:2022-09-28
Applicant: 南京邮电大学
IPC: G06F16/36 , G06F40/216 , G06F40/242 , G06F40/289 , G06F40/30 , G06K9/62 , G06N5/02
Abstract: 本发明公开了一种面向多源移动应用知识图谱构建方法,基于获取的来自不同数据源的移动应用数据,生成三元组集合;对实体与关系进行编码,获得对应的向量表示;计算实体向量之间的相似度,将相似度超过设定阈值的向量表示所对应的实体确定为初始语义等价实体对,并确定种子集合;根据元规则从种子集合中推理出潜在语义等价实体对;计算潜在语义等价实体对成立的概率;将计算的概率与设定概率阈值比较,根据比较结果最终确定多源移动应用中实体之间的语义等价关系,进而获得多源移动应用知识图谱。本发明可以显著降低多源数据在知识图谱构建过程中实体语义等价关系的人工标注成本。
-