-
公开(公告)号:CN113282676A
公开(公告)日:2021-08-20
申请号:CN202010104948.7
申请日:2020-02-20
Applicant: 清华大学
Abstract: 本发明实施例提供一种知识库实体对齐方法和装置,所述方法包括使用图注意力神经模型将待对齐的至少两个知识库进行实体编码,获得注意力增强的实体向量表示,且所述注意力增强的实体向量表示融合了实体邻居信息;基于注意力增强的实体向量表示,使用知识库表示学习模型,获得用于约束所述实体向量表示的第一约束条件;基于预先确定的等价实体对集合,获得第二约束条件;基于所述第一约束条件和所述第二约束条件,实现所述至少两个知识库之间的实体对齐。本发明实施例提供的知识库实体对齐方法和装置,能充分地利用有限的预先对齐的实体对,很好地处理异构知识库之间的差异,提升实体对齐的效果。
-
公开(公告)号:CN113268651A
公开(公告)日:2021-08-17
申请号:CN202110587256.7
申请日:2021-05-27
Applicant: 清华大学
IPC: G06F16/953 , G06F16/9035 , G06F16/9038 , G06F16/9032 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种搜索信息的摘要自动生成方法及装置,该方法包括:获取搜索信息对应的网页文本集,所述搜索信息是属于第一实体类别的信息;将所述网页文本集输入训练好的主题检测模型,输出所述网页文本集对应的主题文本簇集合,其中,所述训练好的主题检测模型是基于携带有主题标签的网页样本文本训练得到的;将所述主题文本簇集合输入训练好的摘要生成模型,得到所述搜索信息的摘要,其中,所述训练好的摘要生成模型是基于携带有摘要文本标签的样本主题文本簇训练得到的。本发明能够有效生成搜索信息的摘要。
-
公开(公告)号:CN113268606A
公开(公告)日:2021-08-17
申请号:CN202110586725.3
申请日:2021-05-27
Applicant: 清华大学
Abstract: 本发明提供一种知识图谱构建方法和装置,方法包括获取原始数据和大规模知识图谱;对所述原始数据进行知识建模,得到知识建模结果;基于所述知识建模结果和所述大规模知识图谱,生成概念层数据;对所述原始数据进行知识获取,其中包括实体抽取、实体分类以及第一实体属性抽取,得到实体、实体类别以及实体属性;将所述实体作为关键词输入所述大规模知识图谱,获取所述实体的实体相关信息;将所述实体、所述实体类别、所述实体属性、所述实体相关信息进行融合,得到完整的实体层数据;基于所述概念层数据与所述实体层数据建构新的知识图谱。本发明通过上述方法实现对知识图谱构建,同时也能够利用上述步骤实现对知识图谱使用过程中的更新。
-
公开(公告)号:CN112182151B
公开(公告)日:2021-08-17
申请号:CN202011012758.9
申请日:2020-09-23
Applicant: 清华大学
IPC: G06F16/33 , G06F16/332 , G06F40/58
Abstract: 本发明实施例提供一种基于多语言的阅读理解任务识别方法及装置,该方法包括:获取任一目标语言的阅读理解任务数据,编码得到上下文嵌入表达向量;将所述嵌入表达向量,输入预设的多语言阅读理解模型,根据多语言阅读理解模型的输出结果,确定阅读理解任务的答案;其中,所述多语言阅读理解模型,以源语言任务数据分别和每一目标语言任务数据的关联语义信息矩阵,进行融合后得到的特征向量作为输入,以源语言任务数据的答案作为标签,进行训练后得到。该方法能够同时支持迁移多语言和多任务数据集中的知识到目标语言中,实现目标语言无数据、少数据条件下的抽取式阅读理解任务,可以提高目标语言少数据以及富数据的抽取式阅读理解任务的准确度。
-
公开(公告)号:CN112650817A
公开(公告)日:2021-04-13
申请号:CN202011444885.6
申请日:2020-12-08
Applicant: 清华大学
IPC: G06F16/28 , G06F40/289
Abstract: 本发明提供一种关键词汇扩展方法及系统、电子设备及存储介质,包括:S1:基于关键词汇,从数据库中提取出与关键词汇相对应的文本数据;S2:对所述文本数据进行实体链接,得到和关键词汇相关的关联要素;S3:基于所述关键词汇和关联要素,进行相关性筛选,得到筛选后的词汇;S4:判断所述筛选后的词汇是否满足预设条件;若是,执行S5;若否,则将所述筛选后的词汇作为关键词汇,返回所述S1;S5:将筛选后的词汇汇总作为关键词汇的相关词汇列表。本发明只需要使用少量的领域种子词汇或种子文本,通过较少的人力成本、时间能够快速实现领域词汇扩展的任务。
-
公开(公告)号:CN112527924A
公开(公告)日:2021-03-19
申请号:CN202011507777.9
申请日:2020-12-18
Applicant: 清华大学
Abstract: 本发明提供一种动态更新的知识图谱扩展方法及装置,所述方法包括:基于第一知识库,进行知识图谱的构建,生成目标领域的知识图谱,其中,所述第一知识库由目标领域的原始数据构成;基于所述目标领域的新知识,生成第二知识库,并将所述第二知识库中的数据扩展到所述知识图谱中,获得更新后的知识图谱;和/或,基于所述知识图谱,执行知识赋能操作,获得所述知识图谱的应用方案,并对所述应用方案执行知识推理操作,得到第三知识库,将所述第三知识库中的数据扩展到所述知识图谱中,获得更新后的知识图谱。本发明提供的动态更新的知识图谱扩展方法及装置,可以实现知识图谱的动态扩展,保证了知识图谱的动态更新和实时性。
-
公开(公告)号:CN111259851A
公开(公告)日:2020-06-09
申请号:CN202010076960.1
申请日:2020-01-23
Applicant: 清华大学
IPC: G06K9/00 , G06F40/211 , G06F40/258 , G06F40/289
Abstract: 本发明实施例提供一种多模态事件检测方法及装置。所述方法包括获取与待测句子匹配的待测图像集合;得到待测句子的初始的句子表达式,并得到各待测图像的图像表达式;采用交替对偶注意力机制,依次根据各图像表达式对句子表达式进行更新,得到更新后的句子表达式;采用残差融合器得到融合后的句子表达式;输入到事件预测模块得到对应的事件检测结果,本发明实施例通过获取待测句子的待测图像,分别编码得到句子表达式和图像表达式,依次根据各待测图像的图像表达式,采用交替对偶注意力机制,对句子表达式进行更新和残差融合,再将融合后的句子表达式通过事件预测模型,得到事件检测结果,从而提升了对于待测文本的事件检测的效率和质量。
-
公开(公告)号:CN102306177B
公开(公告)日:2013-06-05
申请号:CN201110247261.X
申请日:2011-08-25
Applicant: 清华大学
IPC: G06F17/30
Abstract: 本发明公开了一种多策略组合的本体或实例匹配方法,涉及语义万维网领域。所述方法包括步骤:对于两个本体元素或两个实例元素集合,基于本体元素或实例元素的不同文本信息执行多个匹配策略,得到多组匹配结果,对所述多组匹配结果中的每个匹配结果进行投票,根据投票结果对所述多组匹配结果进行过滤,得到初始匹配结果;根据所述初始匹配结果,以及本体元素或者实例元素之间的链接关系,获得新匹配结果,所述初始匹配结果和所述新匹配结果合并后得到最终匹配结果。所述方法提高了最终匹配结果的准确度,有利于更好的解决链接数据模式层和实例层的异构问题。
-
公开(公告)号:CN306900453S
公开(公告)日:2021-10-26
申请号:CN202030811655.3
申请日:2020-12-28
Applicant: 清华大学
Abstract: 1.本外观设计产品的名称:带事件分析搜索图形用户界面的显示屏幕面板。
2.本外观设计产品的用途:用于显示图像。
3.本外观设计产品的设计要点:在于图形用户界面。
4.最能表明设计要点的图片或照片:主视图。
5.本外观设计的后视图、左视图、右视图、俯视图、仰视图为惯常设计,省略后视图、左视图、右视图、俯视图、仰视图。
6.图形用户界面的用途:本申请的界面主要用于新闻事件的分析挖掘和搜索等。
7.图形用户界面的人机交互方式:在主视图界面点击“热点新闻”中任意新闻或点击“查看更多”,界面跳转至变化状态图1,在主视图界面上部点击“体验新闻在线分析”,界面跳转至变化状态图2,在变化状态图2中输入并搜索关键词,界面跳转至变化状态图3,在变化状态图3界面左侧点击任意主题内容,界面跳转至变化状态图4,在主视图界面上部点击“Tech News订阅”,界面跳转至变化状态图5,主视界面展开图为在主视图界面向上滑动后的界面展开状态。
8.显示屏幕面板可用于手机、平板电脑、笔记本电脑、台式机。
9.本申请界面中的黑色或灰色色块部分属于可变的内容画面。-
公开(公告)号:CN306950284S
公开(公告)日:2021-11-19
申请号:CN202030811657.2
申请日:2020-12-28
Applicant: 清华大学
Abstract: 1.本外观设计产品的名称:带知识图谱展示图形用户界面的显示屏幕面板。
2.本外观设计产品的用途:用于显示图像。
3.本外观设计产品的设计要点:在于图形用户界面。
4.最能表明设计要点的图片或照片:主视图。
5.本外观设计的后视图、左视图、右视图、俯视图、仰视图为惯常设计,省略后视图、左视图、右视图、俯视图、仰视图。
6.图形用户界面的用途:本申请的界面主要用于中英文跨语言知识图谱的展示。
7.图形用户界面的人机交互方式:在主视图搜索框内搜索任意关键词,界面跳转至变化状态1;在变化状态图1界面顶部中Xlink选项,界面跳转至变化状态图2;在变化状态图2界面上部搜索框内输入关键字或者段落,界面跳转至变化状态图3;在主视图界面向上滑动,界面跳转至变化状态图4;主视图、变化状态图1至变化状态图4的实际使用状态参见使用状态参考图1‑5。
8.显示屏幕面板可用于手机、平板电脑、笔记本电脑、台式机。
-
-
-
-
-
-
-
-
-