一种基于知识图谱查询的并行抽取方法

    公开(公告)号:CN111091003A

    公开(公告)日:2020-05-01

    申请号:CN201911235588.8

    申请日:2019-12-05

    Abstract: 本发明属于信息抽取的技术领域,具体涉及一种基于知识图谱查询的并行抽取方法,包括:步骤一,提取数据源的URL,获取对应的文本页面;步骤二,对文本页面的内容进行过滤和分词处理,然后在预设的多个规则块中并行地运行信息匹配,对文本页面抽取所需要的实体关系;步骤三,汇总多个规则块的匹配结果,输出对文本页面的抽取结果。本发明的抽取方法可以应用于单文本和多文本的语句,多个规则块能够同时运行、并行地实施所需的匹配,有效地实现了单文本或者多文本中不同的语句的多级并行处理,从而减少了硬件成本和提升了匹配的速度。

    基于开放域信息抽取的人物行为抽取方法

    公开(公告)号:CN111061832A

    公开(公告)日:2020-04-24

    申请号:CN201911236862.3

    申请日:2019-12-05

    Abstract: 本发明属于信息抽取技术领域,具体涉及基于开放域信息抽取的人物行为抽取方法,包括步骤:a、使用CoreNLP工具的Open IE功能生成三元组,三元组对应有元素,元素包括主语、谓语、宾语、时间、地点、间接宾语和其他;其中,t的下标代表三元组的分组号,t的上标代表三元组在组内的序号;b、将表示同一元素的三元组聚合到一起形成分组;c、从分组后的三元组中获取最佳三元组代表其描述的元素;d、将剩余的三元组进行二次分组;e、将三元组的宾语进行分类;f、构建行为链。与现有技术相比,本发明能比较准确的识别出相应的行为元素,并且,使用人物行为抽取能够有效提高文本的利用率,发现更多的人物、机构、地点之间的互动关系。

    基于物理距离和语义距离的双向LSTM模型的构建方法

    公开(公告)号:CN111027695A

    公开(公告)日:2020-04-17

    申请号:CN201911235589.2

    申请日:2019-12-05

    Abstract: 本发明属于计算机技术领域,具体涉及基于物理距离和语义距离的双向LSTM模型的构建方法,包括以下步骤:a、进行数据预处理;b、对LSTM模型中的单词进行向量化处理并对其物理特征和语义特征进行设置;c、构建双向LSTM模型。与现有技术相比,本发明可以有效地在LSTM网络的输入上增加物理特征和语义特征,在特征选择上,不仅仅使用词向量作为特征,更实将位置特征添加进来,将模型的训练集从句子级别细化到了实体对级别;模型构建上,也考虑到了语义上的句法以来,既充分考虑到了两个实体之间的最直接语义特征,降低上下文长度,又考虑到了非最短路径上的词语对分类结果的影响,有效提高了准确率。

    一种基于知识驱动的查询的实体链接方法

    公开(公告)号:CN110888946A

    公开(公告)日:2020-03-17

    申请号:CN201911236844.5

    申请日:2019-12-05

    Abstract: 本发明属于实体链接的技术领域,具体涉及一种基于知识驱动的查询的实体链接方法,包括如下步骤,步骤一、基于句法分析,识别用户查询语句中的命名性实体指称项;步骤二、基于增量证据挖掘,通过外部知识源,对所述实体指称项和本地知识库进行信息扩展;步骤三、采用推理链接算法,对所述实体指称项进行链接处理。本发明能够解决用户查询语句的语境缺乏和描述不规范等问题,并降低对本地知识库的依赖性,还准确实现候选实体的产生和判别,从而提高实体链接的性能。

    面向健康舆情的文本分类方法

    公开(公告)号:CN108829810A

    公开(公告)日:2018-11-16

    申请号:CN201810582880.6

    申请日:2018-06-08

    Abstract: 本发明公开了一种面向健康舆情的文本分类方法,涉及信息技术领域,该面向健康舆情的文本分类方法结合深度神经网络和LightGBM两者的优势,利用深度神经网络自动学习特征,将最后一层特征作为LightGBM集成学习方法的输入,并对多个模型进行模型融合。实现端到端的特征学习,无需人工构建特征工程,且能有效提高文本分类的准确率。该面向健康舆情的文本分类方法采用端到端自动进行特征学习,无需人工构建特征工程;模型通用,无需使用其他外部信息,且与具体应用场景无关;推广能力强,可直接应用于其它文本分类和回归任务;提高文本分类的准确率。

    一种基于概率软逻辑模型的实体解析方法

    公开(公告)号:CN110991186B

    公开(公告)日:2024-02-06

    申请号:CN201911235517.8

    申请日:2019-12-05

    Abstract: 本发明属于实体解析技术领域,具体涉及一种基于概率软逻辑模型的实体解析方法,包括以下步骤:a、将实体解析中的实体属性、实体关系以及本体约束分别进行逻辑谓词表示;b、分别基于实体属性、实体关系以及本体约束构建实体解析过程中的一阶逻辑规则;c、结合步骤a中声明的逻辑谓词与步骤b中构建的逻辑规则设置一个关于实体解析的概率软逻辑模型;d、对概率软逻辑模型进行权重学习;e、使用推理算法对概率软逻辑模型进行计算,通过实体解析概率值。与现有技术相比,本发明通过进行谓词逻辑表示,提出基于实体属性相似度、实体关系、本体约束的逻辑规则构建,实现了概率软逻辑模型的实体解析过程,有效地提高了实体解析的准确率与执行效率。

Patent Agency Ranking