-
公开(公告)号:CN115658931B
公开(公告)日:2023-04-07
申请号:CN202211681737.5
申请日:2022-12-27
Applicant: 清华大学
Abstract: 本申请涉及计算机技术领域,特别涉及一种百科知识图谱动态更新方法、装置、设备及介质,其中,包括:获取百科知识图谱的待更新数据列表,其中,待更新数据列表包括待更新词条的页面文本和/或词条简介中链接的页面文本;根据预设更新周期遍历待更新数据列表,抽取待更新数据列表中页面文本的预设关键信息,基于预设关键信息更新百科知识图谱中三元组,得到更新结果;对更新结果进行结构化,得到更新后的百科知识图谱,并基于更新后的百科知识图谱更新数据库中存储的百科知识图谱。由此,解决了相关技术中需人工手动修改审核更新,无法自动更新和维护百科知识图谱,导致更新效率较低、维护成本较高等问题。
-
公开(公告)号:CN114036317A
公开(公告)日:2022-02-11
申请号:CN202111372439.3
申请日:2021-11-18
Applicant: 清华大学
Abstract: 本发明提供一种旅游知识图谱模型确定方法及装置。其中,该方法包括:从预设的旅游数据源获取相应的旅游知识数据;基于所述旅游知识数据进行概念层建模确定相应的旅游本体;基于所述旅游本体进行实例层建模得到旅游知识图谱模型。本发明提供的旅游知识图谱模型确定方法,能够通过分别构建概念层和实例层来定义面向旅游路径规划的旅游本体和旅游路径实例,丰富旅游知识图谱模型包含内容,以提高查询旅游路径和景点信息的准确度,从而提升用户的使用体验。
-
公开(公告)号:CN113268608A
公开(公告)日:2021-08-17
申请号:CN202110606634.1
申请日:2021-05-27
Applicant: 清华大学
Abstract: 本发明提供一种知识概念层数据构建方法和装置,其中,方法包括获取原始数据和大规模知识图谱;对原始数据进行概念抽取,得到多个概念;对所述概念和所述原始数据进行概念上下位关系抽取,得到不同概念的概念上下位关系;对所述概念和所述原始数据进行概念属性抽取,得到所述概念的概念属性;将所述概念作为关键词输入大规模知识图谱中进行检索,获取所述概念在大规模知识图谱中的概念相关信息;将所述概念、所述概念的上下位关系、所述第一概念属性、所述概念相关信息相融合,得到完整的概念层数据。基于所述概念层数据对大规模知识图谱进行更新。本发明通过上述步骤实现对知识图谱的动态更新以及在使用过程中进行扩展。
-
公开(公告)号:CN112527924B
公开(公告)日:2024-07-23
申请号:CN202011507777.9
申请日:2020-12-18
Applicant: 清华大学
Abstract: 本发明提供一种动态更新的知识图谱扩展方法及装置,所述方法包括:基于第一知识库,进行知识图谱的构建,生成目标领域的知识图谱,其中,所述第一知识库由目标领域的原始数据构成;基于所述目标领域的新知识,生成第二知识库,并将所述第二知识库中的数据扩展到所述知识图谱中,获得更新后的知识图谱;和/或,基于所述知识图谱,执行知识赋能操作,获得所述知识图谱的应用方案,并对所述应用方案执行知识推理操作,得到第三知识库,将所述第三知识库中的数据扩展到所述知识图谱中,获得更新后的知识图谱。本发明提供的动态更新的知识图谱扩展方法及装置,可以实现知识图谱的动态扩展,保证了知识图谱的动态更新和实时性。
-
公开(公告)号:CN113268606A
公开(公告)日:2021-08-17
申请号:CN202110586725.3
申请日:2021-05-27
Applicant: 清华大学
Abstract: 本发明提供一种知识图谱构建方法和装置,方法包括获取原始数据和大规模知识图谱;对所述原始数据进行知识建模,得到知识建模结果;基于所述知识建模结果和所述大规模知识图谱,生成概念层数据;对所述原始数据进行知识获取,其中包括实体抽取、实体分类以及第一实体属性抽取,得到实体、实体类别以及实体属性;将所述实体作为关键词输入所述大规模知识图谱,获取所述实体的实体相关信息;将所述实体、所述实体类别、所述实体属性、所述实体相关信息进行融合,得到完整的实体层数据;基于所述概念层数据与所述实体层数据建构新的知识图谱。本发明通过上述方法实现对知识图谱构建,同时也能够利用上述步骤实现对知识图谱使用过程中的更新。
-
公开(公告)号:CN112650817A
公开(公告)日:2021-04-13
申请号:CN202011444885.6
申请日:2020-12-08
Applicant: 清华大学
IPC: G06F16/28 , G06F40/289
Abstract: 本发明提供一种关键词汇扩展方法及系统、电子设备及存储介质,包括:S1:基于关键词汇,从数据库中提取出与关键词汇相对应的文本数据;S2:对所述文本数据进行实体链接,得到和关键词汇相关的关联要素;S3:基于所述关键词汇和关联要素,进行相关性筛选,得到筛选后的词汇;S4:判断所述筛选后的词汇是否满足预设条件;若是,执行S5;若否,则将所述筛选后的词汇作为关键词汇,返回所述S1;S5:将筛选后的词汇汇总作为关键词汇的相关词汇列表。本发明只需要使用少量的领域种子词汇或种子文本,通过较少的人力成本、时间能够快速实现领域词汇扩展的任务。
-
公开(公告)号:CN112527924A
公开(公告)日:2021-03-19
申请号:CN202011507777.9
申请日:2020-12-18
Applicant: 清华大学
Abstract: 本发明提供一种动态更新的知识图谱扩展方法及装置,所述方法包括:基于第一知识库,进行知识图谱的构建,生成目标领域的知识图谱,其中,所述第一知识库由目标领域的原始数据构成;基于所述目标领域的新知识,生成第二知识库,并将所述第二知识库中的数据扩展到所述知识图谱中,获得更新后的知识图谱;和/或,基于所述知识图谱,执行知识赋能操作,获得所述知识图谱的应用方案,并对所述应用方案执行知识推理操作,得到第三知识库,将所述第三知识库中的数据扩展到所述知识图谱中,获得更新后的知识图谱。本发明提供的动态更新的知识图谱扩展方法及装置,可以实现知识图谱的动态扩展,保证了知识图谱的动态更新和实时性。
-
公开(公告)号:CN113268606B
公开(公告)日:2024-10-29
申请号:CN202110586725.3
申请日:2021-05-27
Applicant: 清华大学
Abstract: 本发明提供一种知识图谱构建方法和装置,方法包括获取原始数据和大规模知识图谱;对所述原始数据进行知识建模,得到知识建模结果;基于所述知识建模结果和所述大规模知识图谱,生成概念层数据;对所述原始数据进行知识获取,其中包括实体抽取、实体分类以及第一实体属性抽取,得到实体、实体类别以及实体属性;将所述实体作为关键词输入所述大规模知识图谱,获取所述实体的实体相关信息;将所述实体、所述实体类别、所述实体属性、所述实体相关信息进行融合,得到完整的实体层数据;基于所述概念层数据与所述实体层数据建构新的知识图谱。本发明通过上述方法实现对知识图谱构建,同时也能够利用上述步骤实现对知识图谱使用过程中的更新。
-
公开(公告)号:CN115658931A
公开(公告)日:2023-01-31
申请号:CN202211681737.5
申请日:2022-12-27
Applicant: 清华大学
Abstract: 本申请涉及计算机技术领域,特别涉及一种百科知识图谱动态更新方法、装置、设备及介质,其中,包括:获取百科知识图谱的待更新数据列表,其中,待更新数据列表包括待更新词条的页面文本和/或词条简介中链接的页面文本;根据预设更新周期遍历待更新数据列表,抽取待更新数据列表中页面文本的预设关键信息,基于预设关键信息更新百科知识图谱中三元组,得到更新结果;对更新结果进行结构化,得到更新后的百科知识图谱,并基于更新后的百科知识图谱更新数据库中存储的百科知识图谱。由此,解决了相关技术中需人工手动修改审核更新,无法自动更新和维护百科知识图谱,导致更新效率较低、维护成本较高等问题。
-
公开(公告)号:CN113094469B
公开(公告)日:2022-07-05
申请号:CN202110363310.X
申请日:2021-04-02
Applicant: 清华大学
IPC: G06F16/33 , G06F40/211 , G06F40/279 , G06F40/295
Abstract: 本发明提供一种文本数据分析方法、装置、电子设备及存储介质,该方法包括:确定目标文本和目标文本中的目标实体,根据目标实体确定关联文本;根据目标文本确定三元组,以及在目标文本中对应于三元组的段落;根据目标文本和关联文本确定对应于目标实体的词云和开放关系;根据三元组、对应于三元组的段落、词云和开放关系确定分析结果。本发明提供的文本数据分析方法、装置、电子设备及存储介质,通过对文本进行分析,得到与目标实体相关联的三元组、段落、词云和开放关系,实现对文本数据的多层次挖掘,构建文本分级知识展示形态,方便对文本的重点了解。
-
-
-
-
-
-
-
-
-