基于实体消歧的数据库中的关键数据元素识别方法及系统

    公开(公告)号:CN113505590A

    公开(公告)日:2021-10-15

    申请号:CN202110839335.2

    申请日:2021-07-23

    IPC分类号: G06F40/279 G06F40/30

    摘要: 本发明公开了一种基于实体消歧的数据库中的关键数据元素识别方法及系统,其包括:结合DeepType模型、DeepMatch模型以及DeepCosine模型对数据库中的数据进行实体类型的预测以及实体的消歧,其中,所述数据库中包括多个数据表;基于Apriori算法以及FP‑growth算法对消歧后的数据库中的数据进行关联分析从而构建数据库表关联图;基于所述数据库表关联图识别出关键数据元素;基于候选实体类型、上下文的关联信息以及候选实体向量对所述关键数据元素进行解析和消歧。本发明的基于实体消歧的数据库中的关键数据元素识别方法及系统,其实现了全电网一张数据库视图,便于及时获取电网中的关键数据元素,可以提高电网行业数据管理效率。