-
公开(公告)号:CN111444713A
公开(公告)日:2020-07-24
申请号:CN201910038950.6
申请日:2019-01-16
Applicant: 清华大学
IPC: G06F40/289 , G06F40/295 , G06F40/211
Abstract: 本发明实施例提供一种新闻事件内实体关系抽取方法及装置,所述方法包括:提取目标新闻事件中与实体相关的语句,并确定目标实体对,提取所述目标实体对出现语句,生成实体对语句集合;分析实体对语句集合中各语句的语义特征,提取用以表示目标实体对关系的多个关键词;根据多个关键词在实体对语句集合中的TF-IDF值进行排序,选取前N个关键词作为表征目标实体对关系的关系词。本发明不需要预先定义实体关系类型以及进行大规模的人工标注数据,具有良好的扩展性,并且对中文新闻句子结构进行了深入分析,能够适应新闻文档涉及领域多和句式复杂的问题,在中文新闻事件上进行实体关系抽取取得了较好的效果。
-
公开(公告)号:CN111444347A
公开(公告)日:2020-07-24
申请号:CN201910038942.1
申请日:2019-01-16
Applicant: 清华大学
Abstract: 本发明实施例提供一种事件演化关系分析方法及装置,所述方法包括:对输入的两个事件分别进行事件要素的抽取,生成所述两个事件各自的事件要素集合;基于所述事件要素集合获取用于分析所述两个事件之间演化关系的演化特征,计算各个演化特征随时间变化的偏移程度,获得所述两个事件的演化关系分析结果。本发明实施例提供的事件演化关系分析方法及装置,利用新闻事件的实体、关键词等事件要素对事件的演化关系进行分析,得到了事件之间的动态关系,解决了已有分析方法只描述事件内部的静态关系的问题,使用户能够迅速掌握事件全局信息以及演化的脉络,对事件的发展趋势的判断具有重要意义。
-
公开(公告)号:CN110909175A
公开(公告)日:2020-03-24
申请号:CN201911140653.9
申请日:2019-11-20
Applicant: 清华大学
IPC: G06F16/36 , G06F16/35 , G06F40/284 , G06F40/289 , G06Q50/20
Abstract: 本发明提出一种基于搜索引擎的在线课程概念知识图谱构建方法,属于信息技术领域。该方法使用外部数据库和自然语言处理的方法,获取了课程文本中的概念,由此得到课程领域分类的结果,同时利用搜索引擎获取概念的搜索结果,提取其中的课程扩展概念,完成概念知识图谱的构建。本发明无需训练数据,可在课程文本这一特殊场景中获取准确且全面的概念,有效构建在线课程概念知识图谱。
-
公开(公告)号:CN110781302A
公开(公告)日:2020-02-11
申请号:CN201911013208.6
申请日:2019-10-23
Applicant: 清华大学 , 腾讯科技(深圳)有限公司
Abstract: 本发明提供了一种文本中事件角色的处理方法、装置、电子设备及存储介质;方法包括:通过角色处理模型中的编码器对文本中的单词进行编码,得到文本中单词的编码信息;通过编码器对文本中单词的编码信息进行特征聚合,得到所述文本的聚合特征;通过所述角色处理模型中的注意力模型,将至少一个事件角色的多个上层概念、以及所述文本中单词的编码信息进行关联,得到所述文本面向所述事件角色的语义向量;通过所述角色处理模型中的分类器对至少一个所述文本面向所述事件角色的语义向量、以及所述文本的聚合特征进行分类,得到对应所述文本的事件角色。通过本发明,能够根据事件角色的上层概念,自动并准确地抽取文本中的事件角色。
-
公开(公告)号:CN102135905B
公开(公告)日:2014-04-02
申请号:CN201110064824.1
申请日:2011-03-17
Applicant: 清华大学
IPC: G06F9/46
Abstract: 本发明公开了一种基于用户定制的本体匹配系统,涉及语义万维网技术领域,包括:本体模块,包括原子组件本体操作接口子模块和本体API子模块;原子组件模块,用于通过原子组件本体操作接口子模块调用本体API子模块的本体API实现原子组件;用户接口模块,用于接收用户上传的待匹配本体和自行实现的原子组件;匹配执行模块,用于根据待匹配本体生成匹配任务描述文件,并根据匹配任务描述文件选择原子组件或自行实现的原子组件来执行匹配任务,生成匹配结果。本发明使用户能够根据匹配本体的特征,对这些原子组件进行定制和组装来设计自己需要的本体匹配流程,生成合适的匹配任务并得到精确地匹配结果。
-
公开(公告)号:CN101321190B
公开(公告)日:2013-01-30
申请号:CN200810116171.5
申请日:2008-07-04
Applicant: 清华大学
Abstract: 本发明涉及一种异构网络中的推荐方法以及基于该方法的推荐系统。异构网络中的推荐方法使用一种统一的模型来模拟多种不同类型的对象以及他们之间可能存在的复杂关系,并借助该模型更好地完成推荐。首先建立社会网络库(其中的对象及其关系均为异构);然后利用重要程度计算装置,对社会网络对象进行全局重要度评估;接着利用相关程度计算装置,对社会网络对象进行相关度评估;也可以再利用浏览历史信息计算装置,得到当前用户的浏览信息;最后利用上述三个基本装置,在社会关系网中,进行给定子图、推荐子图的操作。该推荐方法切实有效,克服了现有技术中只能推荐某一种类型对象的缺陷。
-
公开(公告)号:CN101321190A
公开(公告)日:2008-12-10
申请号:CN200810116171.5
申请日:2008-07-04
Applicant: 清华大学
Abstract: 本发明涉及一种异构网络中的推荐方法以及基于该方法的推荐系统。异构网络中的推荐方法使用一种统一的模型来模拟多种不同类型的对象以及他们之间可能存在的复杂关系,并借助该模型更好地完成推荐。首先建立社会网络库(其中的对象及其关系均为异构);然后利用重要程度计算装置,对社会网络对象进行全局重要度评估;接着利用相关程度计算装置,对社会网络对象进行相关度评估;也可以再利用浏览历史信息计算装置,得到当前用户的浏览信息;最后利用上述三个基本装置,在社会关系网中,进行给定子图、推荐子图的操作。该推荐方法切实有效,克服了现有技术中只能推荐某一种类型对象的缺陷。
-
公开(公告)号:CN101149756A
公开(公告)日:2008-03-26
申请号:CN200710177066.8
申请日:2007-11-09
Applicant: 清华大学
Abstract: 在大规模社会网络中基于路径评分的个人关系发现方法属于互联网中社会网络搜索技术领域,其特征在于基于通用的社会网络,首先定义基于权重的路径评分,再查找出每两个人之间的最短路径,然后开始查找指定的两个人之间的路径长度不大于最短路径的基于倍数的所有路径,最后按照路径评分的顺序把所有路径返回给用户。本发明能应用于节点数超过百万的社会关系网络中,进行人与人之间的关系快速查找或使用于研究者的关系发现。
-
公开(公告)号:CN119557328A
公开(公告)日:2025-03-04
申请号:CN202411539171.1
申请日:2024-10-31
Applicant: 清华大学
IPC: G06F16/2452 , G06F16/242 , G06F16/28 , G06F40/186 , G06N5/04
Abstract: 本发明涉及知识图谱技术领域,提供一种知识图谱的查询语句生成方法、装置及电子设备,该知识图谱的查询语句生成方法包括:获取针对知识图谱的自然语言问句;根据自然语言问句与预先设置的问句模板生成大语言模型问句,问句模板用于引导大语言模型将自然语言问句转换为目标查询语言的语句;根据大语言模型问句向大语言模型提问,得到大语言模型输出的目标查询语言的初始语句;基于初始语句生成目标查询语言的查询语句。该方法提升了知识图谱查询语句的生成效率。
-
公开(公告)号:CN119166767A
公开(公告)日:2024-12-20
申请号:CN202411153889.7
申请日:2024-08-21
Applicant: 清华大学
IPC: G06F16/332 , G06F16/33 , G06F16/36 , G06F40/205 , G06F40/30 , G06N5/022
Abstract: 本发明提供一种基于大语言模型的问答方法及系统,该方法包括:确定用户的当前问题和自然语言理解提示词;输入当前问题和自然语言理解提示词至预训练大语言模型,获得大语言模型根据自然语言理解策略输出的问题理解结果和待回答问题;在问题理解结果为事实性问题的情况下,基于语义解析从知识图谱检索答案;输入检索答案和答案校验提示词至预训练大语言模型,得到答案校验结果;在校验合理的情况下,将检索答案作为当前问题的最终答案;在校验不合理的情况下,大语言模型生成答案。本发明在多轮问答任务中能够基于上下文深入理解用户的问题,有效检索和整合不用的知识源的信息,从而准确、高效地提供当前问题的答案。
-
-
-
-
-
-
-
-
-