-
公开(公告)号:CN110175268B
公开(公告)日:2020-01-17
申请号:CN201910315880.4
申请日:2019-04-19
Applicant: 杭州电子科技大学
IPC: G06F16/901 , G06F16/9032
Abstract: 本发明公开了一种最长匹配资源映射方法。本发明主要为了解决从文本中检测知识库和知识图谱中的资源时,难以检测复合语义资源的问题。本发明采用的技术方案是,为待检测的语句解析为词语流,为每一个词语寻找与其相关的语义资源,然后寻找尽可能多的与原始句子中词语相关的语义资源作为资源映射的结果。同时,为了提升分类的效率,本发明在语句被进行资源映射处理之前对文本做了一定的预处理,提高了检索效率。本发明针对复合语义资源在短语检测和资源映射阶段难以得到合理映射的问题,提出针对邻域中的多个词语的组合资源映射方案,提高了多个词语映射到一个复合语义资源的问题。同时,通过一定的索引优化,提高了查询效率。
-
公开(公告)号:CN109783799A
公开(公告)日:2019-05-21
申请号:CN201811522442.7
申请日:2018-12-13
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于语义依存图的关系提取方法。本发明包括如下步骤:步骤(1)训练双向循环卷积注意神经网络;步骤(2)读取语句数据;步骤(3)将数据输入训练好的深度神经网络,输出数据与各个关系的相关度。本发明通过引入语义依存图的信息来降低噪声数据和增强数据特征信息的方法。通过从语义依存图中提出来的实体对之间的最短路径中提取句子的特征信息。本发明通过引入语义依存图和双向循环卷积注意网络进行关系提取,通过语义依存的分析并提取的实体间最短路径,可以有效的降低远程监督学习带来的噪声数据影响,从而提高了关系提取的准确率。
-
公开(公告)号:CN109783799B
公开(公告)日:2020-05-05
申请号:CN201811522442.7
申请日:2018-12-13
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于语义依存图的关系提取方法。本发明包括如下步骤:步骤(1)训练双向循环卷积注意神经网络;步骤(2)读取语句数据;步骤(3)将数据输入训练好的深度神经网络,输出数据与各个关系的相关度。本发明通过引入语义依存图的信息来降低噪声数据和增强数据特征信息的方法。通过从语义依存图中提出来的实体对之间的最短路径中提取句子的特征信息。本发明通过引入语义依存图和双向循环卷积注意网络进行关系提取,通过语义依存的分析并提取的实体间最短路径,可以有效的降低远程监督学习带来的噪声数据影响,从而提高了关系提取的准确率。
-
公开(公告)号:CN109902144B
公开(公告)日:2020-01-31
申请号:CN201910027346.3
申请日:2019-01-11
Applicant: 杭州电子科技大学
Abstract: 本发明是一种基于改进WMD算法的实体对齐方法。本发明步骤如下:获取同名百科实体对,计算实体对之间的属性相似度;计算实体间的摘要文本相似度;通过属性相似度和摘要文本相似度综合判断完成实体对齐。属性相似度计算包括:规范实体之对间属性名不一致的情况,将实体对的属性值归一单位化,通过编辑距离算法计算实体对之间的属性相似度。摘要文本相似度计算包括:对摘要文本分词并除去停用词,使用TextRank算法计算每个词的词权重,通过预训练好的word2vec模型,将分词后的摘要文本转化为词的分布式低维实数向量表示,将词向量和计算好的单个词权重作为参数。本发明有效降低了单纯依赖属性相似度来进行实体消岐工作带来的误差。
-
公开(公告)号:CN110188342A
公开(公告)日:2019-08-30
申请号:CN201910315854.1
申请日:2019-04-19
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于知识图谱与语义图技术进行口语理解的方法。本发明步骤:1.训练序列到动作序列神经网络模型,训练基于句子和句子逻辑表达式的口语理解神经网络;2.读取需要被解析的自然语言句子;3.使用文本映射算法扫描并替换句子中与知识图谱中语义资源相匹配的部分;4.使用序列到动作序列神经网络模型读取替换了语义资源后的句子,然后执行对应的动作序列生成与句子语义相符的语义图,然后使用深度优先算法遍历语义图得到句子的逻辑表达式;5.使用口语理解神经网络读入句子和逻辑表达式,生成意图信息和槽位信息。本发明提出结合知识图谱和理解句子语义的方法进行口语解析。
-
公开(公告)号:CN109902144A
公开(公告)日:2019-06-18
申请号:CN201910027346.3
申请日:2019-01-11
Applicant: 杭州电子科技大学
Abstract: 本发明是一种基于改进WMD算法的实体对齐方法。本发明步骤如下:获取同名百科实体对,计算实体对之间的属性相似度;计算实体间的摘要文本相似度;通过属性相似度和摘要文本相似度综合判断完成实体对齐。属性相似度计算包括:规范实体之对间属性名不一致的情况,将实体对的属性值归一单位化,通过编辑距离算法计算实体对之间的属性相似度。摘要文本相似度计算包括:对摘要文本分词并除去停用词,使用TextRank算法计算每个词的词权重,通过预训练好的word2vec模型,将分词后的摘要文本转化为词的分布式低维实数向量表示,将词向量和计算好的单个词权重作为参数。本发明有效降低了单纯依赖属性相似度来进行实体消岐工作带来的误差。
-
公开(公告)号:CN110188342B
公开(公告)日:2020-04-07
申请号:CN201910315854.1
申请日:2019-04-19
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于知识图谱与语义图技术进行口语理解的方法。本发明步骤:1.训练序列到动作序列神经网络模型,训练基于句子和句子逻辑表达式的口语理解神经网络;2.读取需要被解析的自然语言句子;3.使用文本映射算法扫描并替换句子中与知识图谱中语义资源相匹配的部分;4.使用序列到动作序列神经网络模型读取替换了语义资源后的句子,然后执行对应的动作序列生成与句子语义相符的语义图,然后使用深度优先算法遍历语义图得到句子的逻辑表达式;5.使用口语理解神经网络读入句子和逻辑表达式,生成意图信息和槽位信息。本发明提出结合知识图谱和理解句子语义的方法进行口语解析。
-
公开(公告)号:CN110175268A
公开(公告)日:2019-08-27
申请号:CN201910315880.4
申请日:2019-04-19
Applicant: 杭州电子科技大学
IPC: G06F16/901 , G06F16/9032 , G06F17/27
Abstract: 本发明公开了一种最长匹配资源映射方法。本发明主要为了解决从文本中检测知识库和知识图谱中的资源时,难以检测复合语义资源的问题。本发明采用的技术方案是,为待检测的语句解析为词语流,为每一个词语寻找与其相关的语义资源,然后寻找尽可能多的与原始句子中词语相关的语义资源作为资源映射的结果。同时,为了提升分类的效率,本发明在语句被进行资源映射处理之前对文本做了一定的预处理,提高了检索效率。本发明针对复合语义资源在短语检测和资源映射阶段难以得到合理映射的问题,提出针对邻域中的多个词语的组合资源映射方案,提高了多个词语映射到一个复合语义资源的问题。同时,通过一定的索引优化,提高了查询效率。
-
-
-
-
-
-
-