-
公开(公告)号:CN111753024A
公开(公告)日:2020-10-09
申请号:CN202010587383.2
申请日:2020-06-24
Applicant: 河北工程大学
IPC: G06F16/28 , G06F40/295 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种面向公共安全领域的多源异构数据实体对齐方法,属于数据融合处理领域。其包括以下步骤:获取公共安全领域多个系统基础数据;抽取多源异构数据实体及关系信息;提取实体属性信息为三元组形式;结合第三方知识库,计算实体属性权重大小;对实体属性信息进行词级别和句级别向量训练;获取实体关系邻接矩阵,使用图嵌入模型训练获得实体结构嵌入向量表示;通过实体名称进行初步实体对齐作为对齐种子;在属性权重约束下联合实体结构信息,计算实体相似度,通过SameAs进行相似实体链接。本发明不依赖于已对齐实体对种子,可以根据需求对齐两个或多个系统所需数据,能够实现公共安全领域不同部门、不同场景上数据的融合互通。
-
公开(公告)号:CN111753024B
公开(公告)日:2024-02-20
申请号:CN202010587383.2
申请日:2020-06-24
Applicant: 河北工程大学
IPC: G06N5/022 , G06F40/295 , G06F40/211 , G06F40/284 , G06N3/0442 , G06N3/0464 , G06N3/082 , G06F18/22
Abstract: 本发明公开了一种面向公共安全领域的多源异构数据实体对齐方法,属于数据融合处理领域。其包括以下步骤:获取公共安全领域多个系统基础数据;抽取多源异构数据实体及关系信息;提取实体属性信息为三元组形式;结合第三方知识库,计算实体属性权重大小;对实体属性信息进行词级别和句级别向量训练;获取实体关系邻接矩阵,使用图嵌入模型训练获得实体结构嵌入向量表示;通过实体名称进行初步实体对齐作为对齐种子;在属性权重约束下联合实体结构信息,计算实体相似度,通过SameAs进行相似实体链接。本发明不依赖于已对齐实体对种子,可以根据需求对齐两个或多个系统所需数据,能够实现公共安全领域不同部门、不同场景上数据的融合互通。
-