一种基于多源知识图谱的三元组可信评估方法

    公开(公告)号:CN112507130B

    公开(公告)日:2024-06-28

    申请号:CN202011438775.9

    申请日:2020-12-10

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于多源知识图谱的三元组可信评估方法,该方法包括步骤S1、对于给定的多源知识图谱,分别得到实体名称,实体类型,属性键值、关系名称的对应向量表示;同时得到多源知识图谱的属性值在嵌入空间下的向量表示;S2、在单个知识图谱内部对三元组的可信度进行评估;S3、对于多源知识图谱中单个知识图谱数据源的可信度评估;S4、对于多源知识图谱情况下共同空间中三元组的可信度评估,由单个知识图谱得到的可信度和多源知识图谱之间的互相影响共同决定,多源知识图谱之间的互相影响由不同数据源之间相互影响的三元组即交互三元组决定;S5、基于多源知识图谱可信评估的训练步骤。本发明的方法提高了三元组可信评估的精度。

    一种基于深度学习的争议焦点生成方法

    公开(公告)号:CN110889502B

    公开(公告)日:2024-02-06

    申请号:CN201910980161.4

    申请日:2019-10-15

    Applicant: 东南大学

    Abstract: 本发明涉及一种基于深度学习的争议焦点生成方法,所述方法包括以下步骤:步骤1)从网络中爬取大量裁判文书;步骤2)利用正则表达式方法对裁判文书进行初步的清洗和整理,抽取出裁判文书中的原告诉称和被告辩称,并对每一对原告诉称和被告辩称进行人工标注,将原告诉称和被告辩称以及人工标注的数据集,以1:1:1的比例构建成训练集;步骤3)使用深度学习中的seq2seq文本生成模型和attention模型对所述步骤2)最终得到的训练数据集进行训练后,导出该训练数据集对应的生成器模型;步骤4)对步骤3)中训练得到的文本生成器,利用训练完成的生成器从未标注的原告诉称和被告辩称中生成双方的争议焦点。

    一种基于上下文线索的语音事件抽取方法

    公开(公告)号:CN117373448A

    公开(公告)日:2024-01-09

    申请号:CN202311252705.8

    申请日:2023-09-26

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于上下文线索的语音事件抽取方法,旨在实现从语音信号中准确地抽取事件信息。该方法包括构建基于上下文线索的语音事件抽取模型,并逐步实现语音编码器和文本解码器。与传统方法不同的是,本发明提出了一种有效的条件生成策略,同时生成语音识别转录文本和序列化事件。其中,语音识别转录文本作为上下文线索,用于协调语音和文本两种模态,从而增强事件抽取的准确性和效果。在经过中英文数据集的实验验证后,结果表明本方法能够有效提升语音事件抽取的输出质量和整体性能。这种基于上下文线索的语音事件抽取方法在多个领域具有广泛的应用前景。

    描述对象的属性值提取方法及相关设备

    公开(公告)号:CN116127080A

    公开(公告)日:2023-05-16

    申请号:CN202111335256.4

    申请日:2021-11-11

    Abstract: 本申请涉及人工智能的知识图谱技术领域,公开了一种描述对象的属性值提取方法及相关设备,该方法包括:获取属性指示文本和目标描述对象的图像文本对集合;由第一神经网络对描述文本和属性指示文本进行特征提取,得到各图像文本对对应的文本特征;由第二神经网络对描述图像进行特征提取,得到各图像文本对对应的图像特征;由融合网络将文本特征和图像特征进行融合,得到融合特征;由第三神经网络根据融合特征,输出各图像文本对与目标属性之间的相关度;由第四神经网络根据融合特征,确定各图像文本对包括的属性值;根据相关度,从图像文本对包括的属性值中确定目标描述对象在目标属性下的属性值;本方案实现了自动提取描述对象的属性值。

    针对少样本文本转SQL任务流的半监督持续学习方法

    公开(公告)号:CN115982586A

    公开(公告)日:2023-04-18

    申请号:CN202310025951.3

    申请日:2023-01-09

    Applicant: 东南大学

    Abstract: 本发明涉及一种针对少样本文本转SQL任务流的半监督持续学习方法,所述方法包括以下步骤:步骤1,对于新任务,模型使用任务内部的半监督学习进行训练,步骤2,对于任务流中过去的任务,模型使用持续学习将保持对已经学过的任务的记忆,步骤3,利用“教师‑学生”框架分别执行半监督学习过程与持续学习过程;步骤4,利用双重采样加强执行半监督学习与持续学习,分别包括提示采样和复习采样,加强两个学习过程的相互促进。该技术方案应用了“教师‑学生”框架来隔离半监督学习和持续学习的不同优化目标,并采用双重采样策略来加强它们之间的相互促进作用。

    一种面向多模态数据的突发事件论元抽取方法

    公开(公告)号:CN115718828A

    公开(公告)日:2023-02-28

    申请号:CN202211416446.3

    申请日:2022-11-12

    Applicant: 东南大学

    Inventor: 柏超宇 漆桂林

    Abstract: 本发明公开了一种新的基于机器阅读理解技术的事件论元抽取方法,主要用于在已知突发事件类型的情况下,抽取事件论元。本方案主要分为两个部分,一部分是图像描述生成模块,该模块针对包含突发事件的微博配图使用ResNet抽取出图像特征,接着采用一种束搜索的方式从图像特征中解码出关于微博图片的文字描述,通过该方法引入图像的信息,增强模型的输入。另一部分是论元抽取模块,该模块将识别出的突发事件类型以及待抽取的事件论元生成问题,使用机器阅读理解的方式从微博文本和图像描述中抽取所需的事件论元。

    一种面向持续少样本学习的主动复杂关系抽取方法

    公开(公告)号:CN115563315A

    公开(公告)日:2023-01-03

    申请号:CN202211527785.9

    申请日:2022-12-01

    Applicant: 东南大学

    Abstract: 本发明公开了一种面向持续少样本学习的主动复杂关系抽取方法,属于计算机自然语言处理领域,该方案设计基于模拟学习的主动学习方法,考虑结合无标注数据完成数据的累积,并且充分利用后增的标注数据,以弥补数据漂移带来的影响、提升模型的效果;在每个任务结束后结合持续学习策略,缓解图谱构建场景中持续新增关系的问题,使得少样本场景下的数据累积和关系扩增问题得到有效的解决。在每个任务结束后结合持续学习策略,缓解了图谱构建场景中持续新增关系导致的一系列问题。从而使得实际应用中,少样本场景下的数据累积和关系扩增问题得到有效的解决。

    面向Web表格的成对实体联合消歧方法

    公开(公告)号:CN113361283A

    公开(公告)日:2021-09-07

    申请号:CN202110720148.2

    申请日:2021-06-28

    Applicant: 东南大学

    Abstract: 本发明公开了面向Web表格的成对实体联合消歧方法,用于解决面向Web表格的实体链接任务。面向Web表格的实体链接任务是将Web表格中的实体提及无歧义的链接到知识库中的实体。本发明针对表格特点设计成对实体联合消歧方法,迭代的对置信度最高的一对实体提及联合消歧,逐步实现整个表格中实体提及的全部消歧。置信度计算方法全面考虑了多种信息,包括实体提及和候选实体的相似度、链接实体之间的一致性以及表格中行、列语义一致性。在算法迭代过程中,已链接的实体具有很高的置信度,能够为后续链接工作提供有效的辅助信息,从而实现高质量的联合消歧。

    一种基于混合专家模型和联合学习的知识库问题生成方法

    公开(公告)号:CN113127623A

    公开(公告)日:2021-07-16

    申请号:CN202110490812.9

    申请日:2021-05-06

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于混合专家模型和联合学习的知识库问题生成方法,主要用于给定知识图谱三元组子图、答案和复杂关系信息的情况下生成与给定三元组子图相关的,可被答案回答的,并且对应给定关系信息的、多样化的复杂自然语言表述问题。本发明使用图神经网络对输入三元组子图进行编码,得到输入子图的向量表示。使用Transformer网络进行解码,生成问题。在解码过程中结合复杂问题场景,使用隐变量建模有效表示关系的结构信息。此外使用混合专家模型,指导问题生成,提升生成问题的多样性。最后使用知识图谱问答任务与知识图谱问题生成任务联合训练,用于约束问题生成过程,使生成的问题包含期望的复杂关系信息,实现生成复杂问题的目的。

    一种基于多种实体上下文的实体对齐方法

    公开(公告)号:CN112988917A

    公开(公告)日:2021-06-18

    申请号:CN202110346496.8

    申请日:2021-03-31

    Applicant: 东南大学

    Abstract: 本专利公开了一种基于多种实体上下文的实体对齐方法,主要处理因为实体结构异构性、实体属性异构性以及实体文本描述异构性引起的实体对齐困难问题。对于实体结构异构性问题,本专利使用TransE和RDF2Vec方法分别处理一跳和多跳结构信息,获取实体结构编码。对于实体属性异构性,本专利使用图卷积网络技术和图注意力机制,对每个实体按其属性的重要性提取其属性、属性值的信息,并映射到低维稠密的向量空间中。对于实体文本描述异构性,本专利使用预训练语言模型BERT获取文本语义信息,基于种子对齐实体信息进行模型的训练和学习,将实体的文本信息映射到低维稠密的向量空间。最后,本专利使用拼接技术和多视角技术对多种实体上下文进行联合对齐学习。

Patent Agency Ranking