-
公开(公告)号:CN115617954A
公开(公告)日:2023-01-17
申请号:CN202211440775.1
申请日:2022-11-17
Applicant: 清华大学
IPC: G06F16/33 , G06F16/332 , G06N5/04
Abstract: 本发明涉及人工智能技术领域,提供一种问答方法、装置、电子设备及存储介质,其中方法包括:将问题输入生成模型,获得问题对应的推理程序;基于目标知识库执行问题对应的推理程序得到问题的答案;生成模型是基于目标知识库之外的外部知识库和对应的第一数据集,以及目标知识库和对应的第二数据集,进行训练得到的,第一数据集包括第一问题样本和对应的第一推理程序标签,第二数据集包括第二问题样本和对应的答案样本;生成模型用于通过解码程序的树形结构所转换的序列中每个位置的词汇得到问题对应的推理程序;或者,通过解析程序骨架以及程序骨架所需的参数得到问题对应的推理程序。解决平行语料缺失的问题,提升了问答性能。
-
公开(公告)号:CN114036307B
公开(公告)日:2022-09-13
申请号:CN202111095446.3
申请日:2021-09-17
Applicant: 清华大学
IPC: G06F16/36
Abstract: 本发明提供一种知识图谱实体对齐方法及装置,包括:获取待融合的两个知识图谱的数据;分别对两个知识图谱的数据进行邻域聚合的实体表示学习,得到两个知识图谱中各实体的实体表示;根据实体表示进行增强实体语义的关系表示学习,对实体间的关系进行建模,得到实体关系表示;根据实体表示进行概念与概念层次体系表示学习,对实体与概念、概念与概念之间的关系进行建模,得到概念与概念层次体系表示;通过实体关系表示、概念与概念层次体系表示对实体表示在基于向量距离的实体对齐过程中进行约束,得到两个知识图谱实体对齐的结果。将概念与概念层次体系融合进实体对齐框架并使其发挥作用,提高实体对齐的准确率。
-
公开(公告)号:CN114817510A
公开(公告)日:2022-07-29
申请号:CN202210715592.X
申请日:2022-06-23
Applicant: 清华大学
IPC: G06F16/332 , G06F40/186 , G06N5/04
Abstract: 本发明涉及人工智能技术领域,提供一种问答方法、问答数据集生成方法及装置,方法包括:获取待回答问题,将待回答问题输入至问答模型,得到待回答问题的答案;问答模型是基于问答数据集得到的,针对提问策略库的每种问题模板,从提问对象库中选择与第一占位符对应的若干目标元素,基于元素描述策略库的M种元素描述模板生成目标元素的M个元素描述信息,将若干目标元素的M个元素描述信息依次替换问题模板中对应的第一占位符,生成多个第一问题;基于第一问题中具有别名的元素将第一问题转写成第二问题,并通过生成第二问题的释义将第二问题转写成第三问题;基于所有第三问题及目标元素生成问答数据集,解决了问答数据集的质量问题,提高了质量。
-
公开(公告)号:CN114781471A
公开(公告)日:2022-07-22
申请号:CN202110614418.1
申请日:2021-06-02
Applicant: 清华大学
IPC: G06K9/62 , G06N3/04 , G06N3/08 , G06F40/295
Abstract: 本发明提供一种实体记录匹配方法及系统,该方法包括:获取待匹配的实体记录集合,所述实体记录集合中的实体记录是由实体的属性和属性值组成的;将所述实体记录集合输入到训练好的实体记录匹配模型,得到所述实体记录集合中实体记录之间的匹配结果,其中,所述训练好的实体记录匹配模型是由自监督学习方法训练后的神经网络和决策树算法训练后的决策树模型构建得到的。本发明通过神经网络对实体转换为属性值向量,利用自动构建的关键属性树,克服深度学习可解释性差的缺点,能将学习到的关键属性树转化成匹配规则,运用到其他数据集中;同时,本发明对应模型的训练仅需要少量的标记实体记录对,克服了现有方法需要大量标记实体记录对的缺点。
-
公开(公告)号:CN114036307A
公开(公告)日:2022-02-11
申请号:CN202111095446.3
申请日:2021-09-17
Applicant: 清华大学
IPC: G06F16/36
Abstract: 本发明提供一种知识图谱实体对齐方法及装置,包括:获取待融合的两个知识图谱的数据;分别对两个知识图谱的数据进行邻域聚合的实体表示学习,得到两个知识图谱中各实体的实体表示;根据实体表示进行增强实体语义的关系表示学习,对实体间的关系进行建模,得到实体关系表示;根据实体表示进行概念与概念层次体系表示学习,对实体与概念、概念与概念之间的关系进行建模,得到概念与概念层次体系表示;通过实体关系表示、概念与概念层次体系表示对实体表示在基于向量距离的实体对齐过程中进行约束,得到两个知识图谱实体对齐的结果。将概念与概念层次体系融合进实体对齐框架并使其发挥作用,提高实体对齐的准确率。
-
公开(公告)号:CN113486142A
公开(公告)日:2021-10-08
申请号:CN202110412919.1
申请日:2021-04-16
IPC: G06F16/33 , G06F16/9535 , G06F40/30 , G06K9/62 , G06N3/04
Abstract: 本申请涉及人工智能领域中的自然语言处理技术,公开了一种基于义原的词语语义的预测方法及计算机设备,该方法在知网的基础上,基于义原构建词语的义原空间,并将知网中的已知词语表示在义原空间内,词语在义原空间的向量表示由两部分组成,一部分取值由类别义原决定,另一部分取值由扩展描述及扩展描述与类别义原的关联关系决定,由于义原含义明确,因此本申请用于表征词语的向量具有可解释性;在面对新增词语,可计算新增词语与已知词语间的相关性,由已知词语在义原空间的向量表示推导出新增词语的向量表示,经由该方法预测得到的新增词语具有强表征能力。本申请方法可与推荐系统结合,用于解决推荐系统的新词理解和表示问题,提升推荐质量。
-
公开(公告)号:CN112100398B
公开(公告)日:2021-09-14
申请号:CN202010931215.0
申请日:2020-09-07
Applicant: 清华大学
Abstract: 本发明实施例提供一种专利空白预测方法及系统,包括:获取预设时间段内的历史专利,生成历史文本文件;提取历史文本文件中的实体和各实体之间的关系;将实体作为节点,将关系作为边,构建专利知识图谱;在专利知识图谱中预测未连边的两个节点间所存在的潜在边,以构建新的专利知识图谱;根据新的专利知识图谱,获取目标预测专利。本发明实施例提供的专利空白预测方法及系统,利用历史专利文档数据中的实体和关系构建专利知识图谱,通过图神经网络算法来预测专利知识图谱中潜在的三元组,以实现空白专利的预测,为明确科技研究方向与新专利的申报方向提供了便捷的途径。
-
公开(公告)号:CN113297386A
公开(公告)日:2021-08-24
申请号:CN202010108590.5
申请日:2020-02-21
Applicant: 清华大学
Abstract: 本发明实施例提供一种限定领域的实体链接方法和装置,所述限定领域的实体链接方法包括:通过实体提及‑知识库实体字典,获取待链接文本中的实体提及和候选实体集;将获取的所述实体提及和候选实体集的全局特征和局部特征输入到实体消歧模型,获得所述实体消歧模型输出的所述候选实体集中的候选实体是所述实体提及指代的知识库实体的概率;根据所述候选实体集中的候选实体是所述实体提及指代的知识库实体的概率,确定待链接文本的实体链接。本发明实施例的限定领域的实体链接方法,可以免去人工标注工作,且链接准确率高。
-
公开(公告)号:CN113282745A
公开(公告)日:2021-08-20
申请号:CN202010104947.2
申请日:2020-02-20
Applicant: 清华大学
IPC: G06F16/35 , G06F16/335 , G06F16/9535 , G06F40/216
Abstract: 本发明实施例提供一种事件百科文档自动生成方法和装置,所述事件百科文档自动生成方法包括:基于现存的与待处理事件同事件类别的百科文档,生成该事件类别的主题树,其中所述主题树包括多个主题;获取所述待处理事件的相关文档集合;基于所述相关文档集合和所述主题树,确定与多个所述主题分别对应的目标文本信息;根据与多个所述主题分别对应的所述目标文本信息,确定与多个所述主题分别对应的摘要;基于与多个所述主题分别对应的所述摘要,生成所述待处理事件的百科文档。本发明实施例的事件百科文档自动生成方法,可以对新事件自动生成包括多个主题的百科文档,使得生成的百科文档目录更完善,更细致地描述事件不同方面的重点信息。
-
公开(公告)号:CN113158672A
公开(公告)日:2021-07-23
申请号:CN202110326769.2
申请日:2021-03-26
Applicant: 清华大学
IPC: G06F40/295 , G06F40/242 , G06F40/30 , G06K9/62 , G06F16/36
Abstract: 本发明提供一种基于新闻事件的关系分析方法及装置,其中方法包括:获取多篇新闻文本;对多篇新闻文本进行聚类,得到聚类后的多个新闻事件;对多个新闻事件进行实体链接、实体抽取、实体关系抽取、事件关系抽取、实体与事件关系抽取,根据实体链接结果、实体抽取结果、实体关系抽取结果、事件关系抽取结果、实体与事件关系抽取结果进行关联分析得到分析结果。本发明通过原始新闻文本聚类实现新闻事件级别分析,得到多个事件,再通过对事件文本抽取实体、实体关系、事件关系、事件与实体的关系。进而通过实体链接,将实体背景知识进行补充,实现对事件的深层次挖掘,从而使读者能够获得更全面和深入的信息。
-
-
-
-
-
-
-
-
-