结合本体的分布式RDF存储与查询优化方法

    公开(公告)号:CN104462610A

    公开(公告)日:2015-03-25

    申请号:CN201510003243.5

    申请日:2015-01-06

    Applicant: 福州大学

    CPC classification number: G06F17/30935

    Abstract: 本发明涉及一种结合本体的分布式RDF存储与查询优化方法,包括以下步骤:步骤S1:采用IOMSQ算法对RDF数据文件进行分割存储;步骤S2:对分割后的数据文件进行查询预处理;步骤S3:对分割后的数据文件进行分布式查询;步骤S4:进行数据更新,所述的数据更新包括新增数据,删除数据,修改数据。本发明采用了IOMSQ算法来解决索引文件过大,Job启动过多的情况,并且保证了查询效率。

    时间感知的多图结构时态知识图谱补全模型构建方法

    公开(公告)号:CN119204188A

    公开(公告)日:2024-12-27

    申请号:CN202411352753.9

    申请日:2024-09-26

    Applicant: 福州大学

    Abstract: 本发明涉及一种时间感知的多图结构时态知识图谱补全模型构建方法,包括:多类型结构信息编码器,其将在时态知识图谱上与要查询实体相关的事实分为三个部分:查询时间之前发生的事实、查询时间之后发生的事实以及与查询时间并发的事实,并采用三个不同的注意力网络来处理这三种类型下的邻居结构信息,将三种不同的邻居结构信息通过线性层后再聚合到实体嵌入上;多周期时间信息解码器,其构造多种周期长度为质数的周期性时间嵌入,使用注意力机制来判断所查询的头实体和关系对哪些周期嵌入更为敏感从而组合出一个新的周期嵌入,最后使用该周期嵌入作为过滤器应用于基于Conv‑TransE的解码器中。该方法构建的多图结构时态知识图谱补全模型具有更佳的表达能力。

    基于模态层次融合的多模态知识图谱补全方法

    公开(公告)号:CN119089992A

    公开(公告)日:2024-12-06

    申请号:CN202411113918.7

    申请日:2024-08-14

    Applicant: 福州大学

    Abstract: 本发明提出基于模态层次融合的多模态知识图谱补全方法,使用多模态知识图谱补全模型MHF来引入视觉特征和文本特征,模型包括:独立学习层:从多个模态分割的数据集的知识图谱独立学习结构嵌入#imgabs0#、视觉嵌入#imgabs1#、文本嵌入#imgabs2#,同时采用缩放因子调整外部特征的规模;模态融合层:将结构特征分别与视觉特征和文本特征融合,得到两种融合嵌入,纳入最终的损失计算;语义约束层:通过因子交互正则化器对前述五种嵌入进一步处理,处理过程产生的额外的五个正则化损失项,计算在最终损失中;本发明通过整合结构数据与外部数据,从而更合理地应用视觉数据和文本数据,有效地提高了模型的表达能力,为知识图谱中实体的全面性和准确性表示提供了新的思路。

    基于碎片化知识下的卷积嵌入表示推理方法

    公开(公告)号:CN111160536B

    公开(公告)日:2022-06-21

    申请号:CN202010002425.1

    申请日:2020-01-02

    Applicant: 福州大学

    Inventor: 汪璟玢 黄腾飞

    Abstract: 本发明涉及一种基于碎片化知识下的卷积嵌入表示推理方法,包括以下步骤:获取事实三元组;判断事实三元组中实体和关系是否已经训练;去掉头实体或者尾实体,使完整的事实三元组破坏并形成缺失事实三元组,并将其放入CE‑RCF模型中计算得到评估结果,如果该评估结果大于设定阈值,则将事实三元组标记为已训练事实三元组;判断未训练事实三元组数量是否大于阈值,如果大于阈值则将全部事实三元组放入CE‑RCF模型中进行参数训练,否则将当前事实三元组标记为未训练事实三元组;将未训练的事实三元组和已训练事实三元组共同取出并合并,输入CE‑RCF模型进行训练或重新训练;将合并后的全部事实三元组标记为已训练事实三元组并存储,得到完善后的事实三元组。

    基于Spark Streaming的流式RDF数据并行推理算法

    公开(公告)号:CN108763451B

    公开(公告)日:2022-03-11

    申请号:CN201810521793.X

    申请日:2018-05-28

    Applicant: 福州大学

    Inventor: 汪璟玢 陈晓曦

    Abstract: 本发明涉及一种基于Spark Streaming的流式RDF数据并行推理算法。首先结合OWL Horst推理规则,构建相应的规则连接变量关系表;在迭代并行推理阶段定时获取Streaming数据流中的批量新数据以及前次推理产生的数据作为输入数据,对输入的模式数据和实例数据进行归类处理并存储到相应的Redis集群;然后,根据规则连接变量关系表,判断本次推理能够激活的规则,结合相应的实例数据产生推理数据;最后,删除本次推理产生的重复数据并存储,本次迭代推理结束。本发明减少了MapReduce的任务数,结合Spark进行流式数据的迭代推理;设计规则连接变量关系表来存储数据以及推理中产生的新数据,保证了算法的完备性;设计了实例三元组的存储方案,结合Redis的特性,以空间换时间,实现了实例数据的快速读取。

    基于无监督类型约束的上下文感知知识补全方法及系统

    公开(公告)号:CN114020923A

    公开(公告)日:2022-02-08

    申请号:CN202111158961.1

    申请日:2021-09-30

    Applicant: 福州大学

    Inventor: 汪璟玢 赖晓连

    Abstract: 本发明涉及一种基于无监督类型约束的上下文感知知识补全方法及系统,该方法构建基于无监督类型约束的上下文感知模型,首先,通过设定时间粒度,对数据集预处理,以使数据在时间分布上均衡;其次,在四元组结构模块中,通过邻居编码器聚合实体上下文信息,增强实体的嵌入表示;在四元组类型模块中,将四元组嵌入到实数空间,四元组类型模块在无监督环境下获得类型约束的实体表示,通过实体潜在类型信息进一步约束实体嵌入表示,提高模型补全能力;最后,将四元组结构模块的得分与四元组类型模块的得分按照设定的权重聚合,获得四元组的最终得分。该方法及系统提高了实体嵌入的质量,提升了模型在知识补全任务上的性能。

    基于关系特定门过滤的开放世界知识补全方法及系统

    公开(公告)号:CN114003730A

    公开(公告)日:2022-02-01

    申请号:CN202111273809.8

    申请日:2021-10-29

    Applicant: 福州大学

    Inventor: 汪璟玢 雷晶

    Abstract: 本发明涉及一种基于关系特定门过滤的开放世界知识补全方法,包括以下步骤:步骤S1:通过关系感知注意力聚合器获得实体的文本嵌入,利用封闭世界知识补全模型获得实体的结构嵌入,并将文本嵌入通过关系特定门过滤的对齐模块对齐到结构空间;步骤S2:训练关系感知注意力聚合器、对齐函数和关系特定门中的参数;步骤S3:通过封闭世界知识补全模型对三元组进行评分,实现开放世界背景下的知识补全。本发明考虑关系对文本描述和实体的影响,优化实体的文本嵌入和实体嵌入,实现开放世界背景下的知识补全。

    一种基于Spark Streaming的流式RDF数据多关键词并行搜索方法

    公开(公告)号:CN108509543B

    公开(公告)日:2021-11-02

    申请号:CN201810227329.X

    申请日:2018-03-20

    Applicant: 福州大学

    Inventor: 汪璟玢 于龙

    Abstract: 本发明涉及一种基于Spark Streaming的流式RDF数据多关键词并行搜索方法,首先将输入的关键词映射到RDF本体图上的类顶点或属性边,构建RDF本体类‑属性二维模型,通过类之间的关系进行剪枝、去重、连接操作,构建对应的本体查询子图;提出一种相关性评价函数,从结构紧密度和内容关联度两个方面对本体查询子图评分、排序;根据本体查询子图的优先级,评分高的先进行搜索,利用MapReduce计算框架并行搜索RDF数据图上匹配的实例三元组,按本体查询子图连接关系进行连接得到前Top‑k的结果。本发明不仅避免了在大量数据图顶点上迭代搜索顶点间连接路径,还提高了查询的精确度,进而提高搜索效率。

    一种基于SWRL的任意规则推理引擎设计方法

    公开(公告)号:CN109684485B

    公开(公告)日:2021-09-28

    申请号:CN201811594867.9

    申请日:2018-12-25

    Applicant: 福州大学

    Inventor: 汪璟玢 李娟

    Abstract: 本发明涉及一种基于SWRL的任意规则推理引擎设计方法,基于优先一次原则和并行原则,在规则解析过程中,通过分析任意规则体前件的元素出现的次数,确定推理连接的优先级;在迭代连接中,通过迭代连接器解析出每次迭代需要的连接变量以及规则原子,并激活推理连接器;在推理连接中,进行推理连接直至产生规则后件所需的三元组。本发明通过在每次迭代过程中,尽可能多的连接规则原子的情况下,减少迭代次数。实现用户自定义规则的并行化、自动化推理。

    基于OWKBC模型的知识库补全方法

    公开(公告)号:CN112561064A

    公开(公告)日:2021-03-26

    申请号:CN202011518699.2

    申请日:2020-12-21

    Applicant: 福州大学

    Inventor: 汪璟玢 苏华

    Abstract: 本发明涉及一种基于OWKBC模型的知识库补全方法,包括以下步骤:步骤S1:获取知识库数据,并预处理,得到的实体对应的文本嵌入表示和图像嵌入表示;步骤S2:结合多模态知识编码器和TransE模型,构建基于翻译的多模态知识编码器;步骤S3:将实体的图像嵌入表示和文本嵌入表示输入到基于翻译的多模态知识编码器,得到实体和关系的嵌入表示;步骤S4:根据得到的实体和关系的嵌入表示输入到解码器中,获得实体和关系之间潜在的语义关系,完成知识库补全。本发明能够有效融合实体对应的图像信息和文本信息生成实体的嵌入表示,解决OOKB(Out‑Of‑Knowledge‑Base)实体问题,完成开放世界下的知识库补全。

Patent Agency Ranking