一种基于语义与结构采样策略的实体对齐方法和装置

    公开(公告)号:CN117556016A

    公开(公告)日:2024-02-13

    申请号:CN202311596284.0

    申请日:2023-11-27

    摘要: 本申请涉及一种基于语义与结构采样策略的实体对齐方法,包括将选择的未标注实体的上一次迭代得到的边界不确定性数值和未标记实体链接的其他实体的上一次迭代的边界不确定性数值迭代计算,得到未标记实体的边界不确定性的数值,根据未标记实体的边界不确定性的数值,选择标注实体标注并更新标记数据集,利用更新后标记数据集实体对齐模型训练,重复上述步骤,直到实体对齐模型满足预设训练结果。本申请优先标注对知识图谱融合更有价值的数据,更新语义表征模型和实体对齐模型,提升采样策略的效果,不断迭代上述过程,在有限的预算下,可以实现更好的实体对齐效果。本申请还涉及一种基于语义与结构采样策略的实体对齐装置、设备和存储介质。