一种实体关系抽取方法、终端设备及计算机可读存储介质

    公开(公告)号:CN113130025B

    公开(公告)日:2023-11-24

    申请号:CN202010047654.5

    申请日:2020-01-16

    Applicant: 中南大学

    Abstract: 本发明公开了一种实体关系抽取方法、终端设备及计算机可读存储介质,其方法包括:从电子病历文本数据库中人工抽取若干个符合预设实体关系的二元实体对作为种子实例;对每个种子实例,均在电子病历文本数据库中查找包括种子实例的句子,并提取该句子的特征向量;基于特征向量对种子实例进行聚类;均根据其中种子实例以及种子实例相应有句子的特征向量,生成与该聚类集群对应的提取模板;使用提取模板在电子病历文本数据库中提取候选实例;根据候选实例与提取模板之间的实体关系,计算各候选实例的置信度,以根据置信度确认是否要将该候选实例作为新的种子实例进行下一轮次迭代。本发明能够较大幅度的提高电子病历实体关系抽取的准确率。

    一种实体关系抽取方法、终端设备及计算机可读存储介质

    公开(公告)号:CN113130025A

    公开(公告)日:2021-07-16

    申请号:CN202010047654.5

    申请日:2020-01-16

    Applicant: 中南大学

    Abstract: 本发明公开了一种实体关系抽取方法、终端设备及计算机可读存储介质,其方法包括:从电子病历文本数据库中人工抽取若干个符合预设实体关系的二元实体对作为种子实例;对每个种子实例,均在电子病历文本数据库中查找包括种子实例的句子,并提取该句子的特征向量;基于特征向量对种子实例进行聚类;均根据其中种子实例以及种子实例相应有句子的特征向量,生成与该聚类集群对应的提取模板;使用提取模板在电子病历文本数据库中提取候选实例;根据候选实例与提取模板之间的实体关系,计算各候选实例的置信度,以根据置信度确认是否要将该候选实例作为新的种子实例进行下一轮次迭代。本发明能够较大幅度的提高电子病历实体关系抽取的准确率。

    基于深度学习的中文电子病历实体及关系联合抽取方法

    公开(公告)号:CN112542222A

    公开(公告)日:2021-03-23

    申请号:CN202011516382.5

    申请日:2020-12-21

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于深度学习的中文电子病历实体及关系联合抽取方法,包括:1,预处理得到语句序列特征的每个字对应的特征向量X;2,将待抽取的关系用三元组表示为(s,r,o);将X作为实体抽取层网络的输入,预测获得实体subject的实体信息;3,将X和实体信息拼接作为自注意力机制的key和value,获取注意力权重α,将α和1‑α分别作为权重,以加权求和的方式得到两者结合的信息向量;4,基于信息向量获得实体object的首尾位置和关系类别r;5,基于三元组(s,r,o),根据实体subject的实体类别和关系类别r,得到实体object的实体类别。本发明对关系重叠和单句多关系的识别效果良好,解决了实体信息和编码信息的自适应结合问题,能够准确有效地联合抽取中文电子病历中的实体及关系。

    一种跨事件新闻文本情感分析方法

    公开(公告)号:CN108829806A

    公开(公告)日:2018-11-16

    申请号:CN201810578907.4

    申请日:2018-06-07

    Applicant: 中南大学

    Abstract: 本发明公开了一种跨事件新闻文本情感分析方法,包括:抓取若干篇用于训练的关于事件A、待分析情感的关于事件B的新闻文本;将事件A的每篇新闻文本的情感倾向进行标记;提取事件A、事件B的新闻文本的TF-IDF特征以形成文本特征矩阵XA和XB;利用迁移成份分析算法将事件A的文本特征矩阵XA、事件B的文本特征矩阵XB进行迁移学习,将XA和XB映射到高维空间,分别对应得到新的特征矩阵XA'和XB';将人工情感标记进行标签化,形成用于训练的标签集合;将XA'、XB'和所述标签集合作为机器学习算法的输入,得到跨事件新闻文本情感分析模型。本发明采用迁移成分分析方法,将两个具有不同分布的事件的新闻文本文档进行迁移学习,可以提高跨事件新闻文本情感分析的准确度。

    基于深度学习的中文电子病历实体及关系联合抽取方法

    公开(公告)号:CN112542222B

    公开(公告)日:2024-02-02

    申请号:CN202011516382.5

    申请日:2020-12-21

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于深度学习的中文电子病历实体及关系联合抽取方法,包括:1,预处理得到语句序列特征的每个字对应的特征向量X;2,将待抽取的关系用三元组表示为(s,r,o);将X作为实体抽取层网络的输入,预测获得实体subject的实体信息;3,将X和实体信息拼接作为自注意力机制的key和value,获取注意力权重α,将α和1‑α分别作为权重,以加权求和的方式得到两者结合的信息向量;4,基于信息向量获得实体object的首尾位置和关系类别r;5,基于三元组(s,r,o),根据实体subject的实体类别和关系类别r,得到实体object的实体类别。本发明对关系重叠和单句多关系的识别效果良好,解决了实体信息和编码信息的自适应结合问题,能够

    基于字词信息融合的中文电子病历实体抽取方法

    公开(公告)号:CN111243699A

    公开(公告)日:2020-06-05

    申请号:CN202010034747.4

    申请日:2020-01-14

    Applicant: 中南大学

    Inventor: 高琰 王艳东 唐琎

    Abstract: 本发明公开了一种基于字词信息融合的中文电子病历实体抽取方法,获取中文电子病历中的中文词向量和字向量,得到词向量表和字向量表;将文档分句分字,使用字向量表查取对应的字向量;获取每个字的上下文词语并对词语的词向量进行特征提取,得到每个字的上下文词语信息;获取注意力权重,用权重结合每个字的字向量和对应字的上下文词语信息,得到新的字信息表征;提取每个字的序列信息;利用条件随机场对序列信息进行标注识别,获得句子中每个字的BIO类别,并解码识别结果,得到具体的医学实体。本发明减少了人工抽取,能够自动学习并结合中文字词信息,提取字词特征,有效提高中文医学命名实体识别结果。

Patent Agency Ranking