一种基于规则和统计学习的变形实体识别方法和装置

    公开(公告)号:CN110008307A

    公开(公告)日:2019-07-12

    申请号:CN201910048233.1

    申请日:2019-01-18

    Abstract: 本发明涉及一种基于规则和统计学习的变形实体识别方法和装置。该方法定义目标实体生成变形实体的规则,并且通过这些规则定义演绎生成算法,为每个目标实体生成大量的候选变形实体集合;利用目标实体和变形实体所在文本的上下文语义相似性,提出基于统计学习的方法来识别出上面候选变形实体集合中真正对应于目标实体的变形实体。本发明既可以找到尽可能多的变形实体,又通过识别模型保证了最终识别出的变形实体的准确性,具有良好的实用性。

    一种基于规则和统计学习的变形实体识别方法和装置

    公开(公告)号:CN110008307B

    公开(公告)日:2021-12-28

    申请号:CN201910048233.1

    申请日:2019-01-18

    Abstract: 本发明涉及一种基于规则和统计学习的变形实体识别方法和装置。该方法定义目标实体生成变形实体的规则,并且通过这些规则定义演绎生成算法,为每个目标实体生成大量的候选变形实体集合;利用目标实体和变形实体所在文本的上下文语义相似性,提出基于统计学习的方法来识别出上面候选变形实体集合中真正对应于目标实体的变形实体。本发明既可以找到尽可能多的变形实体,又通过识别模型保证了最终识别出的变形实体的准确性,具有良好的实用性。

    一种基于异构外部知识源图结构抽取答案信息的方法

    公开(公告)号:CN111581326B

    公开(公告)日:2022-05-31

    申请号:CN202010238159.2

    申请日:2020-03-30

    Abstract: 本发明提出一种基于异构外部知识源图结构抽取答案信息的方法,属于自然语言处理领域,为了提升问答返回的答案质量,本方法结合使用结构化知识和非结构化知识这两种异构的知识源,在获得相应的知识以后,使用结构化技术对知识进行建图处理,并结合图卷积网络技术学习图的表示,结合文本和图的信息来对从后台文本数据中返回能够正确回答用户问题的答案。本方法能够根据问题和答案的匹配程度对答案进行重排,将用户关心和期待的答案展示在最前面,使搜索结果更具针对性,使用户能够在更短的查询时间内得到更想要的答案。

    一种事件发展脉络图生成方法

    公开(公告)号:CN111382276B

    公开(公告)日:2023-06-20

    申请号:CN201811631236.X

    申请日:2018-12-29

    Abstract: 本发明公开了一种事件发展脉络图生成方法。本方法为:1)对语料库中的每一新闻文本,生成该新闻文本的向量表示并抽取该新闻文本中的实体、事件隐含话题;2)计算目标事件的新闻文本与语料库中各新闻文本之间的实体相似性、话题相似性和向量表示相似性,并根据计算结果选取该目标事件的新闻集合;3)将该新闻集合中的每一篇新闻文本看作该目标事件的事件发展脉络图中的一节点,并计算节点之间的相似度,如果两节点的相似度大于设定阈值,则生成一连接该两节点的边,从而生成该新闻集合的新闻文本关系图;4)对该新闻文本关系图进行子事件划分,得到若干子事件阶段;5)根据每个子事件阶段对应的代表性文档生成该目标事件的事件发展脉络图。

    一种基于异构外部知识源图结构抽取答案信息的方法

    公开(公告)号:CN111581326A

    公开(公告)日:2020-08-25

    申请号:CN202010238159.2

    申请日:2020-03-30

    Abstract: 本发明提出一种基于异构外部知识源图结构抽取答案信息的方法,属于自然语言处理领域,为了提升问答返回的答案质量,本方法结合使用结构化知识和非结构化知识这两种异构的知识源,在获得相应的知识以后,使用结构化技术对知识进行建图处理,并结合图卷积网络技术学习图的表示,结合文本和图的信息来对从后台文本数据中返回能够正确回答用户问题的答案。本方法能够根据问题和答案的匹配程度对答案进行重排,将用户关心和期待的答案展示在最前面,使搜索结果更具针对性,使用户能够在更短的查询时间内得到更想要的答案。

    一种事件发展脉络图生成方法

    公开(公告)号:CN111382276A

    公开(公告)日:2020-07-07

    申请号:CN201811631236.X

    申请日:2018-12-29

    Abstract: 本发明公开了一种事件发展脉络图生成方法。本方法为:1)对语料库中的每一新闻文本,生成该新闻文本的向量表示并抽取该新闻文本中的实体、事件隐含话题;2)计算目标事件的新闻文本与语料库中各新闻文本之间的实体相似性、话题相似性和向量表示相似性,并根据计算结果选取该目标事件的新闻集合;3)将该新闻集合中的每一篇新闻文本看作该目标事件的事件发展脉络图中的一节点,并计算节点之间的相似度,如果两节点的相似度大于设定阈值,则生成一连接该两节点的边,从而生成该新闻集合的新闻文本关系图;4)对该新闻文本关系图进行子事件划分,得到若干子事件阶段;5)根据每个子事件阶段对应的代表性文档生成该目标事件的事件发展脉络图。

Patent Agency Ranking