一种基于多层划分框架的RDF分布式存储方法

    公开(公告)号:CN109344259B

    公开(公告)日:2022-02-22

    申请号:CN201810803364.1

    申请日:2018-07-20

    Abstract: 本发明公开了一种基于多层划分框架的RDF分布式存储方法,主要步骤包括:(1)通过MMA算法优化RDF图中的顶点移动,保护了RDF图中小社团;(2)通过MSLM算法对RDF图进行粗糙化,发现了RDF图中的社团结构,并且在此基础了缩小了RDF数据的规模;(3)通过B_AP算法实现了对RDF图的k‑way分割,使得各个物理存储节点之间的数据量相对平衡并且降低了节点之间的通信代价。本发明提出了完整的RDF分布式存储方法,为提升RDF的查询效率奠定了基础。

    一种面向文本的知识主题间认知关系抽取方法

    公开(公告)号:CN110188347B

    公开(公告)日:2021-01-19

    申请号:CN201910356243.1

    申请日:2019-04-29

    Abstract: 本发明提供一种面向文本的知识主题间认知关系抽取方法,不仅判断出知识主题间存在的依赖关系,更具有方向性。可根据过滤后的认知关系三元组指导知识主题的学习。其包括以下步骤:(1)对待识别文本进行预处理得到预处理结果文本;(2)结合词以及句子层面因素,抽取预处理结果文本中影响认知关系的词特征和句子特征,构成认知关系特征集;(3)利用多节点标记规则,通过训练的条件随机场模型进行句子层面序列标注;根据认知关系特征集,抽取句子中存在的所有认知关系三元组;(4)计算认知关系三元组中知识主题词重要性,根据词语重要性原则,对抽取出认知关系三元组进行过滤,从而抽取出知识主题间认知关系。

    一种面向文本的知识主题间认知关系抽取方法

    公开(公告)号:CN110188347A

    公开(公告)日:2019-08-30

    申请号:CN201910356243.1

    申请日:2019-04-29

    Abstract: 本发明提供一种面向文本的知识主题间认知关系抽取方法,不仅判断出知识主题间存在的依赖关系,更具有方向性。可根据过滤后的认知关系三元组指导知识主题的学习。其包括以下步骤:(1)对待识别文本进行预处理得到预处理结果文本;(2)结合词以及句子层面因素,抽取预处理结果文本中影响认知关系的词特征和句子特征,构成认知关系特征集;(3)利用多节点标记规则,通过训练的条件随机场模型进行句子层面序列标注;根据认知关系特征集,抽取句子中存在的所有认知关系三元组;(4)计算认知关系三元组中知识主题词重要性,根据词语重要性原则,对抽取出认知关系三元组进行过滤,从而抽取出知识主题间认知关系。

    一种基于多轮注意力机制的机器阅读理解答案获取方法

    公开(公告)号:CN110083682A

    公开(公告)日:2019-08-02

    申请号:CN201910318268.2

    申请日:2019-04-19

    Abstract: 本发明公开了一种基于多轮注意力机制的机器阅读理解答案获取方法,对所述问题和问题对应的文本分别进行分词处理和向量化处理得到特征向量,选择双向长短时记忆网络对特征向量编码上下文语义信息,使用注意力机制进行问题和文本之间的建模,可以有效地捕捉问题和文本之间的信息交互;通过多轮计算文章关于问题的注意力,并融合上下文语义信息,再使用BLSTM编码上下文语义信息,反复多次得到第n文本语义向量,利用Self-Attention机制得到问题的一个向量表示,通过计算问题语义向量和自身的相似度,即文章中的每个词在问题空间中的一种表示,可以有效地提高预测答案的准确度,将BLSTM和Attention进行有效的结合,能够提升问题与文本抽取所返回的答案相匹配的精准性。

    一种基于多层划分框架的RDF分布式存储方法

    公开(公告)号:CN109344259A

    公开(公告)日:2019-02-15

    申请号:CN201810803364.1

    申请日:2018-07-20

    Abstract: 本发明公开了一种基于多层划分框架的RDF分布式存储方法,主要步骤包括:(1)通过MMA算法优化RDF图中的顶点移动,保护了RDF图中小社团;(2)通过MSLM算法对RDF图进行粗糙化,发现了RDF图中的社团结构,并且在此基础了缩小了RDF数据的规模;(3)通过B_AP算法实现了对RDF图的k-way分割,使得各个物理存储节点之间的数据量相对平衡并且降低了节点之间的通信代价。本发明提出了完整的RDF分布式存储方法,为提升RDF的查询效率奠定了基础。

    一种基于多轮注意力机制的机器阅读理解答案获取方法

    公开(公告)号:CN110083682B

    公开(公告)日:2021-05-28

    申请号:CN201910318268.2

    申请日:2019-04-19

    Abstract: 本发明公开了一种基于多轮注意力机制的机器阅读理解答案获取方法,对所述问题和问题对应的文本分别进行分词处理和向量化处理得到特征向量,选择双向长短时记忆网络对特征向量编码上下文语义信息,使用注意力机制进行问题和文本之间的建模,可以有效地捕捉问题和文本之间的信息交互;通过多轮计算文章关于问题的注意力,并融合上下文语义信息,再使用BLSTM编码上下文语义信息,反复多次得到第n文本语义向量,利用Self‑Attention机制得到问题的一个向量表示,通过计算问题语义向量和自身的相似度,即文章中的每个词在问题空间中的一种表示,可以有效地提高预测答案的准确度,将BLSTM和Attention进行有效的结合,能够提升问题与文本抽取所返回的答案相匹配的精准性。

    一种结合主动学习的社区问答网站答案排序方法及系统

    公开(公告)号:CN112434517A

    公开(公告)日:2021-03-02

    申请号:CN202011240697.1

    申请日:2020-11-09

    Abstract: 一种结合主动学习的社区问答网站答案排序方法及系统,排序方法包括步骤S1进行问答数据表征和建模,步骤S2结合主动学习构建训练集以及候选问答对排序关系预测。本发明同时提供了一种结合主动学习的社区问答网站答案排序系统。本发明首先对CQA网站问答数据进行表征和建模,通过长尾因子解决社区数据长尾分布给答案排序带来的干扰,在卷积神经网络中引入注意力机制缓解问答文本间的语义鸿沟问题。然后将主动学习和答案排序相结合,在基于规则自动构建标注训练集外,还构建未标注训练集,在未标注训练集中额外选择样本进行标注,将标注结果合并之后再次训练答案排序模型,从而实现以尽可能低的标注代价换取到尽可能高的模型性能。

Patent Agency Ranking