实体处理方法、装置和存储介质

    公开(公告)号:CN109684625B

    公开(公告)日:2021-01-12

    申请号:CN201811290669.3

    申请日:2018-10-31

    Abstract: 本发明提供一种实体处理方法、装置和存储介质,该方法包括:对知识图谱中的目标实体进行分组,获取多个实体组,每个实体组中包括多个目标实体对;获取每个实体组的每个目标实体对中的两个目标实体的相似度,并将相似度大于相似度阈值的两个目标实体进行融合,获取多个新的实体组;在多个新的实体组中获取待建边客体的关联实体,并将待建边客体与关联实体进行关联;待建边客体为待建边的三元组中的客体,待建边客体的关联实体为:与待建边客体的相似度大于相似度阈值的目标实体。本发明在新的实体集中进行实体建边,使得实体融合和实体建边进行了关联,提高了知识图谱的连通度,且采用相似度的方式进行实体融合,提高了实体融合的准确性。

    实体处理方法、装置和存储介质

    公开(公告)号:CN109684625A

    公开(公告)日:2019-04-26

    申请号:CN201811290669.3

    申请日:2018-10-31

    Abstract: 本发明提供一种实体处理方法、装置和存储介质,该方法包括:对知识图谱中的目标实体进行分组,获取多个实体组,每个实体组中包括多个目标实体对;获取每个实体组的每个目标实体对中的两个目标实体的相似度,并将相似度大于相似度阈值的两个目标实体进行融合,获取多个新的实体组;在多个新的实体组中获取待建边客体的关联实体,并将待建边客体与关联实体进行关联;待建边客体为待建边的三元组中的客体,待建边客体的关联实体为:与待建边客体的相似度大于相似度阈值的目标实体。本发明在新的实体集中进行实体建边,使得实体融合和实体建边进行了关联,提高了知识图谱的连通度,且采用相似度的方式进行实体融合,提高了实体融合的准确性。

    文档处理方法、装置和存储介质

    公开(公告)号:CN109657010A

    公开(公告)日:2019-04-19

    申请号:CN201811273922.4

    申请日:2018-10-30

    Abstract: 本发明提供一种文档处理方法、装置和存储介质,该方法包括:将多个文档转换为多个网页文档;根据每个网页文档的实体,将多个网页文档划分为多个文档集合,每个文档集合包含有至少一个网页文档,至少一个网页文档的实体相同,文档集合对应的实体为文档集合所包括的至少一个网页文档的实体;根据每个文档集合对应的实体,以及实体与实体类型的对应关系,获取每个文档集合对应的实体类型。本发明将不同类型的文档转换为统一的网页文档,便于进行文档的结构化处理;且根据每个网页文档的实体,将文档进行分类,便于构建知识图谱。

    文档处理方法、装置和存储介质

    公开(公告)号:CN109657010B

    公开(公告)日:2020-10-09

    申请号:CN201811273922.4

    申请日:2018-10-30

    Abstract: 本发明提供一种文档处理方法、装置和存储介质,该方法包括:将多个文档转换为多个网页文档;根据每个网页文档的实体,将多个网页文档划分为多个文档集合,每个文档集合包含有至少一个网页文档,至少一个网页文档的实体相同,文档集合对应的实体为文档集合所包括的至少一个网页文档的实体;根据每个文档集合对应的实体,以及实体与实体类型的对应关系,获取每个文档集合对应的实体类型。本发明将不同类型的文档转换为统一的网页文档,便于进行文档的结构化处理;且根据每个网页文档的实体,将文档进行分类,便于构建知识图谱。

Patent Agency Ranking