RDF数据分布式并行语义编码方法

    公开(公告)号:CN105930419A

    公开(公告)日:2016-09-07

    申请号:CN201610242787.1

    申请日:2016-04-19

    Applicant: 福州大学

    Inventor: 汪璟玢 郑翠春

    CPC classification number: G06F16/2471 G06F16/24564 G06F17/2785

    Abstract: 本发明涉及一种RDF数据分布式并行语义编码方法,具体包括以下步骤:步骤S1:读入RDF本体文件,构建类关系模型和属性关系模型;步骤S2:读入RDF数据文件,将三元组分割成三元组项,将三元组项按类划分,并删除重复的三元组项,同时生成前缀编码;对三元组项进行过滤,用以确保RDF三元组编码的一致性,使得同一个三元组项不会分配到不同的编码;步骤S3:将三元组项进行编码,生成字典表;步骤S4:将三元组进行编码,生成编码后的三元组文件;步骤S5:将步骤S4的结果文件作为此步骤的输入,根据步骤S3中的字典表,反转生成原始RDF数据文件。本发明在分布式环境下结合本体能够高效地实现大规模数据的压缩编码与反转。

    利用低频采集卡采集脉冲信号的方法

    公开(公告)号:CN103425803B

    公开(公告)日:2016-06-01

    申请号:CN201310346011.0

    申请日:2013-08-10

    Applicant: 福州大学

    Abstract: 本发明涉及信号采集技术领域,特别是一种利用低频采集卡采集脉冲信号的方法,将采集卡上的n路采集信道配置为k路全频率采集信道和n-k路分频率采集信道,当需要采集脉冲信号时,在一段时间间隔t中,将采集卡的最大采样频率全部分配给所述k路全频率采集信道中的s路,循环┌k/s┐次,完成k路全频率采集信道中所有脉冲信号的采集,其中,s≥1,┌k/s┐表示对k/s的值向上取整;如果采集的是普通低频信号,则将最大采样频率分配给n-k路分频率采集信道,采集所述n-k路分频率采集信道中的普通低频信号。该方法不仅可以采集较高频率信号尤其是脉冲信号,而且节省资源,投入成本小,使用效果好。

    结合本体的分布式RDF存储与查询优化方法

    公开(公告)号:CN104462610A

    公开(公告)日:2015-03-25

    申请号:CN201510003243.5

    申请日:2015-01-06

    Applicant: 福州大学

    CPC classification number: G06F17/30935

    Abstract: 本发明涉及一种结合本体的分布式RDF存储与查询优化方法,包括以下步骤:步骤S1:采用IOMSQ算法对RDF数据文件进行分割存储;步骤S2:对分割后的数据文件进行查询预处理;步骤S3:对分割后的数据文件进行分布式查询;步骤S4:进行数据更新,所述的数据更新包括新增数据,删除数据,修改数据。本发明采用了IOMSQ算法来解决索引文件过大,Job启动过多的情况,并且保证了查询效率。

    时间感知的多图结构时态知识图谱补全模型构建方法

    公开(公告)号:CN119204188A

    公开(公告)日:2024-12-27

    申请号:CN202411352753.9

    申请日:2024-09-26

    Applicant: 福州大学

    Abstract: 本发明涉及一种时间感知的多图结构时态知识图谱补全模型构建方法,包括:多类型结构信息编码器,其将在时态知识图谱上与要查询实体相关的事实分为三个部分:查询时间之前发生的事实、查询时间之后发生的事实以及与查询时间并发的事实,并采用三个不同的注意力网络来处理这三种类型下的邻居结构信息,将三种不同的邻居结构信息通过线性层后再聚合到实体嵌入上;多周期时间信息解码器,其构造多种周期长度为质数的周期性时间嵌入,使用注意力机制来判断所查询的头实体和关系对哪些周期嵌入更为敏感从而组合出一个新的周期嵌入,最后使用该周期嵌入作为过滤器应用于基于Conv‑TransE的解码器中。该方法构建的多图结构时态知识图谱补全模型具有更佳的表达能力。

    基于模态层次融合的多模态知识图谱补全方法

    公开(公告)号:CN119089992A

    公开(公告)日:2024-12-06

    申请号:CN202411113918.7

    申请日:2024-08-14

    Applicant: 福州大学

    Abstract: 本发明提出基于模态层次融合的多模态知识图谱补全方法,使用多模态知识图谱补全模型MHF来引入视觉特征和文本特征,模型包括:独立学习层:从多个模态分割的数据集的知识图谱独立学习结构嵌入#imgabs0#、视觉嵌入#imgabs1#、文本嵌入#imgabs2#,同时采用缩放因子调整外部特征的规模;模态融合层:将结构特征分别与视觉特征和文本特征融合,得到两种融合嵌入,纳入最终的损失计算;语义约束层:通过因子交互正则化器对前述五种嵌入进一步处理,处理过程产生的额外的五个正则化损失项,计算在最终损失中;本发明通过整合结构数据与外部数据,从而更合理地应用视觉数据和文本数据,有效地提高了模型的表达能力,为知识图谱中实体的全面性和准确性表示提供了新的思路。

    基于碎片化知识下的卷积嵌入表示推理方法

    公开(公告)号:CN111160536B

    公开(公告)日:2022-06-21

    申请号:CN202010002425.1

    申请日:2020-01-02

    Applicant: 福州大学

    Inventor: 汪璟玢 黄腾飞

    Abstract: 本发明涉及一种基于碎片化知识下的卷积嵌入表示推理方法,包括以下步骤:获取事实三元组;判断事实三元组中实体和关系是否已经训练;去掉头实体或者尾实体,使完整的事实三元组破坏并形成缺失事实三元组,并将其放入CE‑RCF模型中计算得到评估结果,如果该评估结果大于设定阈值,则将事实三元组标记为已训练事实三元组;判断未训练事实三元组数量是否大于阈值,如果大于阈值则将全部事实三元组放入CE‑RCF模型中进行参数训练,否则将当前事实三元组标记为未训练事实三元组;将未训练的事实三元组和已训练事实三元组共同取出并合并,输入CE‑RCF模型进行训练或重新训练;将合并后的全部事实三元组标记为已训练事实三元组并存储,得到完善后的事实三元组。

    基于Spark Streaming的流式RDF数据并行推理算法

    公开(公告)号:CN108763451B

    公开(公告)日:2022-03-11

    申请号:CN201810521793.X

    申请日:2018-05-28

    Applicant: 福州大学

    Inventor: 汪璟玢 陈晓曦

    Abstract: 本发明涉及一种基于Spark Streaming的流式RDF数据并行推理算法。首先结合OWL Horst推理规则,构建相应的规则连接变量关系表;在迭代并行推理阶段定时获取Streaming数据流中的批量新数据以及前次推理产生的数据作为输入数据,对输入的模式数据和实例数据进行归类处理并存储到相应的Redis集群;然后,根据规则连接变量关系表,判断本次推理能够激活的规则,结合相应的实例数据产生推理数据;最后,删除本次推理产生的重复数据并存储,本次迭代推理结束。本发明减少了MapReduce的任务数,结合Spark进行流式数据的迭代推理;设计规则连接变量关系表来存储数据以及推理中产生的新数据,保证了算法的完备性;设计了实例三元组的存储方案,结合Redis的特性,以空间换时间,实现了实例数据的快速读取。

    基于无监督类型约束的上下文感知知识补全方法及系统

    公开(公告)号:CN114020923A

    公开(公告)日:2022-02-08

    申请号:CN202111158961.1

    申请日:2021-09-30

    Applicant: 福州大学

    Inventor: 汪璟玢 赖晓连

    Abstract: 本发明涉及一种基于无监督类型约束的上下文感知知识补全方法及系统,该方法构建基于无监督类型约束的上下文感知模型,首先,通过设定时间粒度,对数据集预处理,以使数据在时间分布上均衡;其次,在四元组结构模块中,通过邻居编码器聚合实体上下文信息,增强实体的嵌入表示;在四元组类型模块中,将四元组嵌入到实数空间,四元组类型模块在无监督环境下获得类型约束的实体表示,通过实体潜在类型信息进一步约束实体嵌入表示,提高模型补全能力;最后,将四元组结构模块的得分与四元组类型模块的得分按照设定的权重聚合,获得四元组的最终得分。该方法及系统提高了实体嵌入的质量,提升了模型在知识补全任务上的性能。

    基于关系特定门过滤的开放世界知识补全方法及系统

    公开(公告)号:CN114003730A

    公开(公告)日:2022-02-01

    申请号:CN202111273809.8

    申请日:2021-10-29

    Applicant: 福州大学

    Inventor: 汪璟玢 雷晶

    Abstract: 本发明涉及一种基于关系特定门过滤的开放世界知识补全方法,包括以下步骤:步骤S1:通过关系感知注意力聚合器获得实体的文本嵌入,利用封闭世界知识补全模型获得实体的结构嵌入,并将文本嵌入通过关系特定门过滤的对齐模块对齐到结构空间;步骤S2:训练关系感知注意力聚合器、对齐函数和关系特定门中的参数;步骤S3:通过封闭世界知识补全模型对三元组进行评分,实现开放世界背景下的知识补全。本发明考虑关系对文本描述和实体的影响,优化实体的文本嵌入和实体嵌入,实现开放世界背景下的知识补全。

    一种基于Spark Streaming的流式RDF数据多关键词并行搜索方法

    公开(公告)号:CN108509543B

    公开(公告)日:2021-11-02

    申请号:CN201810227329.X

    申请日:2018-03-20

    Applicant: 福州大学

    Inventor: 汪璟玢 于龙

    Abstract: 本发明涉及一种基于Spark Streaming的流式RDF数据多关键词并行搜索方法,首先将输入的关键词映射到RDF本体图上的类顶点或属性边,构建RDF本体类‑属性二维模型,通过类之间的关系进行剪枝、去重、连接操作,构建对应的本体查询子图;提出一种相关性评价函数,从结构紧密度和内容关联度两个方面对本体查询子图评分、排序;根据本体查询子图的优先级,评分高的先进行搜索,利用MapReduce计算框架并行搜索RDF数据图上匹配的实例三元组,按本体查询子图连接关系进行连接得到前Top‑k的结果。本发明不仅避免了在大量数据图顶点上迭代搜索顶点间连接路径,还提高了查询的精确度,进而提高搜索效率。

Patent Agency Ranking