基于近似本体匹配的知识图谱融合方法

    公开(公告)号:CN113032516B

    公开(公告)日:2021-08-31

    申请号:CN202110581624.7

    申请日:2021-05-27

    Abstract: 本发明提供基于近似本体匹配的知识图谱融合方法,包括:对待融合的知识图谱的集合进行初始化,构建倒排索引,依据所述倒排索引获取本体的共现情况,获取近似匹配本体,根据近似匹配本体提取候选实体对,在名称候选实体对集合和近似匹配本体集合中计算候选实体对在属性上的相似度,根据相似度向量的分量对候选实体初步判别,利用实体的文本特征对所述歧义实体和近义实体进行二次筛选;通过对于知识图谱的本体层进行粗筛,依据筛选结果对计算过程分块,达到缩减计算规模的目的。在各块内利用属性、名称、文本等特征计算实体相似度。

    基于孪生网络的远程监督关系抽取降噪系统

    公开(公告)号:CN112668342A

    公开(公告)日:2021-04-16

    申请号:CN202110024800.7

    申请日:2021-01-08

    Abstract: 本申请实施例涉及一种基于孪生网络的远程监督关系抽取降噪系统,旨在旨在降低远程监督回标训练数据的噪声影响,同时减少训练数据损失的情况。该系统包括:文本分析模块,关系选择器训练模块,关系选择模块,噪声数据聚类模块,关系分类模块;所述文本分析模块用于接收远程监督回标文本数据,输出初始候选数据和初始高可信度数据;所述关系选择器训练模块用于利用标注好的文本数据训练出基于孪生网络的关系选择器;所述关系选择模块用于对初始候选数据和初始高可信度数据进行关系选择,输出噪声数据和新增高可信度数据;所述噪声聚类模块用于对噪声数据进行聚类分析,输出新增候选数据,所述关系分类模块用于输出最后的分类结果。

    基于预训练模型的交叉聚焦损失的溯因推理方法

    公开(公告)号:CN113283605B

    公开(公告)日:2021-11-09

    申请号:CN202110841128.0

    申请日:2021-07-26

    Abstract: 本发明提供基于预训练模型的交叉聚焦损失的溯因推理方法,包括:将观测对O1和O2与所有假设的结合,得到输入序列;将输入序列中的单一输入变量输入预训练模型,得到对应句子级别的特征矩阵,然后对特征矩阵的单词维度求和,得到特征向量;遍历输入序列中所有单一输入变量,得到特征向量序列;将特征向量序列输入双向长短期记忆网络,获取到分布式特征表示,再利用全连接层进行映射求和得到每个输入的分数;将输入序列中N个标签为真的值分别与所有标签为假的值组成N组,并进行组内softmax,得到交叉预测值;引入聚类因子和引入权重因子,改进FocalLoss,得到训练损失函数;优化所述训练损失函数,得到最优的溯因推理模型。

    基于力导向的知识图谱可视化方法

    公开(公告)号:CN113254670A

    公开(公告)日:2021-08-13

    申请号:CN202110665550.5

    申请日:2021-06-16

    Abstract: 本发明提供基于力导向的知识图谱可视化方法,包括:知识图谱数据提取包括:知识图谱构建和知识图谱查询;构造图数据结构:对构建好的知识图谱查询得到的相关的节点和关系进行图数据结构格式转换;力导向算法布局:随机初始化所有节点在屏幕中的坐标;把节点作为电子,使节点彼此之间存在斥力;把关系作为弹簧,使节点彼此之间存在引力;在斥力和引力的作用下迭代n次,最终达到平衡状态,得到所有节点的稳定坐标;可视化呈现:根据所有节点的稳定坐标,分别绘制节点以及节点之间的连线,得到最终知识图谱;运算流程可视化交互:通过最终知识图谱,为每个节点和关系绑定监听事件,使用户能通过鼠标操作节点和关系。

    一种基于张量分解的知识推理方法、装置、设备

    公开(公告)号:CN113051404A

    公开(公告)日:2021-06-29

    申请号:CN202110024807.9

    申请日:2021-01-08

    Abstract: 本申请实施例涉及数据处理技术领域,具体涉及一种基于张量分解的知识推理方法、装置、设备,旨在提高时序知识推理任务的准确率。所述方法包括:对时序知识图谱数据集中的数据进行提取,得到多组四元组数据,多组四元组数据中的每组四元组数据中包含了头实体、关系、尾实体以及时间;对多组四元组数据进行标注及处理,将处理好的四元组数据作为训练材料;将训练材料输入基于张量分解的时序知识推理模型及其变体模型中,利用梯度下降算法对时序知识推理模型及其变体模型分别进行训练,得到训练好的时序知识推理模型及其变体模型;使用训练好的时序知识推理模型及其变体模型分别执行预测任务,推理问题的答案,得到最终的推理结果。

    基于孪生网络的远程监督关系抽取降噪系统

    公开(公告)号:CN112668342B

    公开(公告)日:2024-05-07

    申请号:CN202110024800.7

    申请日:2021-01-08

    Abstract: 本申请实施例涉及一种基于孪生网络的远程监督关系抽取降噪系统,旨在旨在降低远程监督回标训练数据的噪声影响,同时减少训练数据损失的情况。该系统包括:文本分析模块,关系选择器训练模块,关系选择模块,噪声数据聚类模块,关系分类模块;所述文本分析模块用于接收远程监督回标文本数据,输出初始候选数据和初始高可信度数据;所述关系选择器训练模块用于利用标注好的文本数据训练出基于孪生网络的关系选择器;所述关系选择模块用于对初始候选数据和初始高可信度数据进行关系选择,输出噪声数据和新增高可信度数据;所述噪声聚类模块用于对噪声数据进行聚类分析,输出新增候选数据,所述关系分类模块用于输出最后的分类结果。

    一种基于张量分解的知识推理方法、装置、设备

    公开(公告)号:CN113051404B

    公开(公告)日:2024-02-06

    申请号:CN202110024807.9

    申请日:2021-01-08

    Abstract: 本申请实施例涉及数据处理技术领域,具体涉及一种基于张量分解的知识推理方法、装置、设备,旨在提高时序知识推理任务的准确率。所述方法包括:对时序知识图谱数据集中的数据进行提取,得到多组四元组数据,多组四元组数据中的每组四元组数据中包含了头实体、关系、尾实体以及时间;对多组四元组数据进行标注及处理,将处理好的四元组数据作为训练材料;将训练材料输入基于张量分解的时序知识推理模型及其变体模型中,利用梯度下降算法对时序知识推理模型及其变体模型分别进行训练,得到训练好的时序知识推理模型及其变体模型;使用训练好的时序知识推理模型及其变体模型分别执行预测任务,推理问题的答案,得到最终的推理结果。

Patent Agency Ranking