-
公开(公告)号:CN115510814B
公开(公告)日:2023-03-14
申请号:CN202211394785.6
申请日:2022-11-09
Applicant: 东南大学
IPC: G06F40/126 , G06F40/30
Abstract: 本发明公开了一种基于双重规划的篇章级复杂问题生成方法,主要用于依据给定的一篇文章和答案,生成能够被答案回答的自然语言问题序列。本发明首先使用预训练语言模型BERT对给定的文章和答案进行编码,获得答案感知的语义向量。然后针对给定文章中的每个句子序列构建语义结构图,并采用多头注意力机制对这些语义结构图进行编码,获取它们之间的相关信息,用来指导复杂问题生成。最后,采用神经网络Transformer作为解码器生成复杂问题,在解码的每个时间步,基于双重规划,即事实级规划和语义图级规划,选择需要重点关注的语义图和其中的事实三元组,通过融入这些信息增强生成问题的复杂度,辅助当前词汇的生成。
-
公开(公告)号:CN115510814A
公开(公告)日:2022-12-23
申请号:CN202211394785.6
申请日:2022-11-09
Applicant: 东南大学
IPC: G06F40/126 , G06F40/30
Abstract: 本发明公开了一种基于双重规划的篇章级复杂问题生成方法,主要用于依据给定的一篇文章和答案,生成能够被答案回答的自然语言问题序列。本发明首先使用预训练语言模型BERT对给定的文章和答案进行编码,获得答案感知的语义向量。然后针对给定文章中的每个句子序列构建语义结构图,并采用多头注意力机制对这些语义结构图进行编码,获取它们之间的相关信息,用来指导复杂问题生成。最后,采用神经网络Transformer作为解码器生成复杂问题,在解码的每个时间步,基于双重规划,即事实级规划和语义图级规划,选择需要重点关注的语义图和其中的事实三元组,通过融入这些信息增强生成问题的复杂度,辅助当前词汇的生成。
-
公开(公告)号:CN115481741A
公开(公告)日:2022-12-16
申请号:CN202211175184.6
申请日:2022-09-26
Applicant: 东南大学
Abstract: 本发明公开了一种基于嵌入不一致容忍本体推理方法,该方法用于不一致本体推理相关任务并增强在不一致本体上的查询能力。首先,将本体中的公理转化成自然语言形式的句子。随后利用嵌入技术,将自然语言形式的公理句子映射成高维空间的语义向量,利用语义向量计算公理之间的语义联系。最后,通过语义向量之间的语义联系定义不一致容忍的推理关系。使用该推理关系,可以在不一致本体上推理出一致的结果。该推理关系拓展经典逻辑到了描述逻辑领域,具备良好的逻辑性质,同时充分考虑到本体中公理的语义,具备更强的不一致容忍推理能力。
-
公开(公告)号:CN112507699B
公开(公告)日:2022-11-18
申请号:CN202010972885.7
申请日:2020-09-16
Applicant: 东南大学
IPC: G06F40/279 , G06F40/211 , G06F16/36 , G06N3/04 , G06N3/08
Abstract: 本专利公开了一种远程监督关系抽取方法,主要用于解决远程监督关系抽取中信息不充分和监督信息存在噪声的问题。本专利构建了引入多源额外信息的异构图,并以图卷积网络的方式进行建模。本专利首先对所有的信息进行编码,包括待抽取的文本、知识图谱中的实体信息、启发式的文本路径等。然后,本专利把每种信息构建成一个节点,将信息之间的关联性表示为边。接着,通过图卷积网络对所有节点进行特征抽取,然后通过注意力机制对噪声信息进行过滤。最后,通过监督学习的方式对整个框架中的参数进行更新,最后学习到一种灵活性高、表达能力强的关系抽取模型。
-
公开(公告)号:CN114817307A
公开(公告)日:2022-07-29
申请号:CN202210147772.2
申请日:2022-02-17
Applicant: 东南大学
IPC: G06F16/2452 , G06F16/242 , G06N20/00
Abstract: 本专利公开了一种基于半监督学习和元学习的少样本NL2SQL方法。本方法能在仅拥有少量标注数据的场景下,通过自训练框架的辅助对模型进行迭代训练,在这过程中逐步优化模型以及伪标签。首先对基础模型利用已有的少量标注数据进行热启动训练后,将其用于大量无标注数据的伪标签以及置信度预测,并使其与标签数据结合使对模型进行半监督学习。在半监督学习的过程中,同时引入元学习算法,它会在训练过程中进行任务采样,利用其特有任务训练机制来提升模型的快速学习以及迁移学习能力。最终得到的NL2SQL模型具有接近使用大量标注数据在有监督条件下训练的模型的准确率,同时针对新数据具有强大的少样本快速学习与微调的能力。
-
公开(公告)号:CN114490954A
公开(公告)日:2022-05-13
申请号:CN202210403218.6
申请日:2022-04-18
Applicant: 东南大学
IPC: G06F16/33 , G06F16/35 , G06F40/126 , G06F40/205 , G06N3/04 , G06N3/08 , G06N5/04
Abstract: 本发明公开了一种基于任务调节的文档级生成式事件抽取方法,包括以下步骤:构建基于任务调节的文档级生成式事件抽取框架;根据事件抽取任务的事件类型来创建编码器前缀,然后注入编码器;根据事件抽取任务的事件类型和输入文档的词元表示来创建解码器前缀,然后注入解码器;利用最小负对数似然损失函数来训练事件抽取神经网络模型,并且在测试过程中使用约束解码算法;该方案构建了一个生成式事件抽取模型,它将事件类型作为前缀注入基于Transformer模型的每一层,有效提升了模型的F1值,在文档级和零样本事件抽取任务中表现出优越的性能,实现了有效的零样本学习和监督学习,在三个主流数据集上均取得了最先进的效果。
-
公开(公告)号:CN114444517A
公开(公告)日:2022-05-06
申请号:CN202210371281.6
申请日:2022-04-11
Applicant: 东南大学
Abstract: 本发明公开了一种量刑标准知识增强的数值感知的智能法律判决方法,用于解决一般方法缺乏数值感知能力进而在数值法律判决任务上表现较差的问题,提出的该方法包括以下步骤:首先使用PTLM对事实描述编码,获得句子级和词语级的表征;然后;接着使用基于预训练语言模型(PTLM,Pre‑Trained Language Model)的遮蔽数字预测(MNP)来帮助模型获得法律上的数值意义;再从数值表征和选择的法律知识中构建图网络,进行数值推理;最后使用经过以上步骤得到的表征预测类别。本发明在设计时利用了PTLM的优势,同时融入了司法先验,并构建图网络进行数值推理,能够显著提升法律判决准确率。
-
公开(公告)号:CN113377567A
公开(公告)日:2021-09-10
申请号:CN202110722163.0
申请日:2021-06-28
Applicant: 东南大学
Abstract: 本发明公开了一种基于知识图谱技术的分布式系统故障根因溯源方法,用于解决大型分布式系统故障根因溯源困难问题。分布式系统故障根因溯源任务是找出导致系统故障的根本原因。本发明针对分布式系统中的故障为每类故障构建了故障知识图谱,构建过程中使用了模板技术从历史故障数据中生成事件,然后利用机器学习模型学习事件之间的关系构建故障传播图,最后使用合并算法抽取相同类型故障的故障传播图的共有结构生成故障知识图谱。故障发生时,通过构建计算实时故障传播图并与故障知识图谱之间的相似度,得到与实时故障传播图最相似的故障知识图谱,从而根据故障知识图谱标志的故障根因得到导致系统故障的根本原因。
-
公开(公告)号:CN108959461B
公开(公告)日:2021-07-27
申请号:CN201810627959.6
申请日:2018-06-15
Applicant: 东南大学
Abstract: 本发明公开了一种基于图模型的实体链接方法,主要用于处理非结构化文本的实体链接问题。本发明首先将同一文本中得到的所有实体指称项和相应的候选实体集合,构造出一张该文本的实体关联图,作为动态实体消歧算法的依据。然后利用基于图和PageRank的动态实体消歧算法,每轮挑选出最高得分的未消歧候选实体作为该实体指称的目标实体,逐步完成实体指称对应多个候选实体的消歧选择过程。最后使用机器学习领域中的XGBoost对实体指称的目标实体进行判断,将知识库中已登陆的目标实体正确链接,对知识库中未登录的目标实体正确识别。
-
公开(公告)号:CN109241285A
公开(公告)日:2019-01-18
申请号:CN201811001531.7
申请日:2018-08-29
Applicant: 东南大学
Abstract: 一种基于机器学习的辅助司法案件判决的装置,利用大量文书数据,训练模型学习案件事实描述与罚金范围和相关法律条文之间的关联,实现对任意给定案件事实描述文本的罚金额度范围和法条标签进行预测。包括:确定给定案件事实描述文本中专有名词并去专有名词处理;从文本中抽取多种语义特征,实现更深层次的语义表示;基于多标记分类的机器学习方法实现对法条的分类,得到与案件事实描述文本相关的法条标签;基于机器学习的单标记分类训练模型预测相关案情可能的罚金范围。本发明首次将机器学习运用于司法领域,多种特征抽取方式实现更深层次的语义表示,很好的提升训练模型的准确率与泛化能力,对于案件最终判刑有较高参考意义,有助于“同案同判”的实现。
-
-
-
-
-
-
-
-
-