-
公开(公告)号:CN113157819A
公开(公告)日:2021-07-23
申请号:CN202110320754.5
申请日:2021-03-25
Applicant: 东南大学
Abstract: 本发明公开了一种基于规则挖掘的实例匹配方法,用于解决不同知识库之间的融合问题。本发明的方法包括步骤:1)将多个知识库之间已知的等价实例作为种子集合;2)从种子集合的等价实例中挖掘出等价实例的匹配规则,并筛选掉上一轮评估效果不好的匹配规则;3)把匹配规则作用在多个知识库的数据上,匹配得到新的等价实例,把新的等价实例添加到种子集合中;4)利用匹配规则挖掘出的新的等价实例对匹配规则进行评估;5)使用期望最大值算法框架,迭代重复步骤2)~步骤4)的内容,直到没有新的匹配规则和等价实例产生。通过不断迭代,完成等价实例的寻找,实现知识的融合。
-
公开(公告)号:CN112926340A
公开(公告)日:2021-06-08
申请号:CN202110319217.9
申请日:2021-03-25
Applicant: 东南大学
IPC: G06F40/30 , G06F40/289 , G06F40/216
Abstract: 本发明公开了一种用于知识点定位的语义匹配模型,主要用于解决电学领域题目知识点定位的问题。本发明首先对原始教材进行预处理,形成语料。然后,使用基于统计学的语义匹配模型TF‑IDF,LSI以及LDA编码。之后,再使用深度学习的语义匹配模型加强深度语义理解,通过BERT编码。随后,对于以上四种编码方式,计算余弦相似度作为语义相似的衡量。最后,基于投票的语义匹配集成模型根据教材片段出现在前列的次数和余弦相似度选择用户指定数量的教材片段作为最终知识点定位的结果。
-
公开(公告)号:CN112667732A
公开(公告)日:2021-04-16
申请号:CN202110099305.2
申请日:2021-01-25
Applicant: 东南大学
Abstract: 本发明公布了一种基于任务感知元学习的持续关系抽取方法,包括:步骤1)构建基于任务感知元学习的持续关系抽取框架;所述框架包含:关系抽取神经网络分类模型、任务序列、记忆数据仓库、记忆数据选择器、负例标签选择器、元学习网络模型训练方法和参数更新方法。步骤2)结合任务与分类模型交互信息和任务自身语义信息,使用负例标签选择器为训练数据选择合适的负例标签。步骤3)训练关系抽取神经网络模型,并结合元学习思想对模型参数进行更新。步骤4)利用聚类方法从训练数据中挑选出一批记忆缓存。步骤5)将更新后的参数载入到模型,并进行性能测试。所述于基于任务感知元学习的持续关系抽取方法可以有效提升持续关系抽取效果。
-
公开(公告)号:CN112084330A
公开(公告)日:2020-12-15
申请号:CN202010806791.2
申请日:2020-08-12
Applicant: 东南大学
IPC: G06F16/35 , G06F40/295 , G06N3/04
Abstract: 本发明公开了一种基于课程规划元学习的增量关系抽取方法,包括以下步骤:构建课程规划元学习增量关系抽取框架;计算关系间相似度,并根据相似度重新规划记忆缓存训练顺序;训练关系抽取神经网络模型,并结合元学习思想,使用元学习参数更新公式对关系抽取神经网络模型的参数进行更新;利用聚类方法从训练数据中挑选出一批记忆缓存;将更新后的参数载入到关系抽取神经网络模型,并进行性能测试。本发明将课程学习和元学习思想引入到增量关系抽取任务中,有效提升了模型的平均准确率和整体准确率,并降低了模型的误差范围,从而有效缓解了增量学习中的“灾难性遗忘”和“次序敏感”问题,在主流的数据集上取得了优于传统方法的效果。
-
公开(公告)号:CN110059314A
公开(公告)日:2019-07-26
申请号:CN201910278459.0
申请日:2019-04-08
Applicant: 东南大学
Abstract: 本发明公开了一种基于增强学习的关系抽取方法,包括:步骤10)构建强化学习的关系抽取框架;所述关系抽取框架包括基于DNN模型的关系抽取模型、用于表示关系的人类知识形式的软规则和含有查询问题的关系证据、外部的知识源和智能体;步骤20)获取所述基于DNN模型的关系抽取模型的抽取结果;步骤30)所述智能体在强化学习环境中,利用所述软规则和所述关系证据,对所述抽取结果进行动态调整。所述基于增强学习的关系抽取方法可以增强现有的基于DNN的关系抽取模型。
-
公开(公告)号:CN106503148B
公开(公告)日:2019-05-31
申请号:CN201610920031.8
申请日:2016-10-21
Applicant: 东南大学
Abstract: 本发明公开了一种基于多知识库的表格实体链接方法,主要用于解决表格中的实体链接问题。本发明首先对于给定表格中每个单元格里的字符串生成候选实体,这些候选实体抽取自给定的知识库。然后,提出一种通用的基于图的概率传播算法对每个单元格里的字符串对应的候选实体进行排序,该方法可作用于任意单一的知识库。再根据基于不同单一知识库的候选实体排序的结果,利用源自不同知识库中的实体间的等价关系,对每个单元格里的字符串所对应的抽取自不同知识库中的已排序候选实体进行划分。最后使用三种启发式规则以最终确定每个单元格里的字符串所应该链接的存在于不同知识库中的实体,从而完成基于多知识库的表格实体链接的任务。
-
公开(公告)号:CN107180263A
公开(公告)日:2017-09-19
申请号:CN201710461852.4
申请日:2017-06-16
Applicant: 东南大学
IPC: G06N5/04
CPC classification number: G06N5/04
Abstract: 本发明公开了一种基于图模型的方法来做描述逻辑EL本体的并行推理,即通过图上的并行化操作计算本体中概念之间的包含关系。本发明首先对输入的EL本体做规范化处理,并转成语义等价的有向图结构;接着对转化得来的有向图做并行化存储,并同步到并行计算平台;然后利用并行平台的超步(针对不同平台的宏操作)完成一轮推理过程的迭代,分别为:请求、应答、推理、加边;通过多次超步迭代,完成对有向图的更新。最后,将更新完成的有向图逆向转换回EL本体,作为结果输出。
-
公开(公告)号:CN104484433A
公开(公告)日:2015-04-01
申请号:CN201410799922.3
申请日:2014-12-19
Applicant: 东南大学
IPC: G06F17/30
CPC classification number: G06F17/30864
Abstract: 本发明公开了一种基于机器学习的图书本体匹配方法,主要用于处理图书领域的本体匹配问题。本发明首先对于给定的两个图书本体生成所有待匹配的实例对与概念对,再利用启发式实例匹配规则与基于监督学习的决策模型从所有待匹配的实例对中挖掘实例间的等价关系,即得到实例匹配结果。然后对于所有待匹配的概念对使用基于半监督学习的标签传播算法挖掘概念间的上下位与等价关系,从而得到概念匹配结果。最终,将实例匹配结果与概念匹配结果共同作为图书本体匹配的结果。
-
公开(公告)号:CN113127623B
公开(公告)日:2024-11-19
申请号:CN202110490812.9
申请日:2021-05-06
Applicant: 东南大学
IPC: G06F16/332 , G06F16/33 , G06F16/36 , G06N3/0464 , G06N3/047 , G06N3/08
Abstract: 本发明公开了一种基于混合专家模型和联合学习的知识库问题生成方法,主要用于给定知识图谱三元组子图、答案和复杂关系信息的情况下生成与给定三元组子图相关的,可被答案回答的,并且对应给定关系信息的、多样化的复杂自然语言表述问题。本发明使用图神经网络对输入三元组子图进行编码,得到输入子图的向量表示。使用Transformer网络进行解码,生成问题。在解码过程中结合复杂问题场景,使用隐变量建模有效表示关系的结构信息。此外使用混合专家模型,指导问题生成,提升生成问题的多样性。最后使用知识图谱问答任务与知识图谱问题生成任务联合训练,用于约束问题生成过程,使生成的问题包含期望的复杂关系信息,实现生成复杂问题的目的。
-
公开(公告)号:CN118445448A
公开(公告)日:2024-08-06
申请号:CN202311662509.8
申请日:2023-12-05
Applicant: 东南大学
IPC: G06F16/783 , G06F18/213 , G06F40/30
Abstract: 本发明涉及一种基于多层级对比学习的视频文本多模态事件抽取方法,所述方法包括如下步骤:步骤1:采用预训练的I3D模型对给定的视频进行视频外观特征编码,步骤2:采用预训练的PWC模型对给定的视频进行光流特征的抽取,步骤3:采用预训练的T5模型对给定的文本提取文本序列特征,步骤4:对所述步骤3中的文本序列特征直接获得事件触发词特征和事件类型特征,步骤5:对步骤1得到的视频外观特征,步骤2得到的光流特征以及步骤3得到的文本序列特征,将他们送入双边查询文本模块来增强模态之间的交互。
-
-
-
-
-
-
-
-
-