-
公开(公告)号:CN109684625B
公开(公告)日:2021-01-12
申请号:CN201811290669.3
申请日:2018-10-31
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/295 , G06F16/36
Abstract: 本发明提供一种实体处理方法、装置和存储介质,该方法包括:对知识图谱中的目标实体进行分组,获取多个实体组,每个实体组中包括多个目标实体对;获取每个实体组的每个目标实体对中的两个目标实体的相似度,并将相似度大于相似度阈值的两个目标实体进行融合,获取多个新的实体组;在多个新的实体组中获取待建边客体的关联实体,并将待建边客体与关联实体进行关联;待建边客体为待建边的三元组中的客体,待建边客体的关联实体为:与待建边客体的相似度大于相似度阈值的目标实体。本发明在新的实体集中进行实体建边,使得实体融合和实体建边进行了关联,提高了知识图谱的连通度,且采用相似度的方式进行实体融合,提高了实体融合的准确性。
-
公开(公告)号:CN109684625A
公开(公告)日:2019-04-26
申请号:CN201811290669.3
申请日:2018-10-31
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提供一种实体处理方法、装置和存储介质,该方法包括:对知识图谱中的目标实体进行分组,获取多个实体组,每个实体组中包括多个目标实体对;获取每个实体组的每个目标实体对中的两个目标实体的相似度,并将相似度大于相似度阈值的两个目标实体进行融合,获取多个新的实体组;在多个新的实体组中获取待建边客体的关联实体,并将待建边客体与关联实体进行关联;待建边客体为待建边的三元组中的客体,待建边客体的关联实体为:与待建边客体的相似度大于相似度阈值的目标实体。本发明在新的实体集中进行实体建边,使得实体融合和实体建边进行了关联,提高了知识图谱的连通度,且采用相似度的方式进行实体融合,提高了实体融合的准确性。
-
公开(公告)号:CN109657010A
公开(公告)日:2019-04-19
申请号:CN201811273922.4
申请日:2018-10-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/28 , G06F16/958
Abstract: 本发明提供一种文档处理方法、装置和存储介质,该方法包括:将多个文档转换为多个网页文档;根据每个网页文档的实体,将多个网页文档划分为多个文档集合,每个文档集合包含有至少一个网页文档,至少一个网页文档的实体相同,文档集合对应的实体为文档集合所包括的至少一个网页文档的实体;根据每个文档集合对应的实体,以及实体与实体类型的对应关系,获取每个文档集合对应的实体类型。本发明将不同类型的文档转换为统一的网页文档,便于进行文档的结构化处理;且根据每个网页文档的实体,将文档进行分类,便于构建知识图谱。
-
公开(公告)号:CN109657010B
公开(公告)日:2020-10-09
申请号:CN201811273922.4
申请日:2018-10-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/28 , G06F16/958
Abstract: 本发明提供一种文档处理方法、装置和存储介质,该方法包括:将多个文档转换为多个网页文档;根据每个网页文档的实体,将多个网页文档划分为多个文档集合,每个文档集合包含有至少一个网页文档,至少一个网页文档的实体相同,文档集合对应的实体为文档集合所包括的至少一个网页文档的实体;根据每个文档集合对应的实体,以及实体与实体类型的对应关系,获取每个文档集合对应的实体类型。本发明将不同类型的文档转换为统一的网页文档,便于进行文档的结构化处理;且根据每个网页文档的实体,将文档进行分类,便于构建知识图谱。
-
-
-