一种基于文档结构和外部知识的文档级实体关系抽取方法

    公开(公告)号:CN113032585B

    公开(公告)日:2021-08-20

    申请号:CN202110597525.8

    申请日:2021-05-31

    Abstract: 本发明公开了一种基于文档结构和外部知识的文档级实体关系抽取方法,所述方法包括:获取文档文本,并根据所述文档文本构建文档文本对应的结构图,初始化所述结构图的所述结点和所述边,得到结构图初始化结果;基于结构图、所述结构图初始化结果、经过训练的面向边的图神经网络模型,得到更新后的边,并将所述更新后的边输入分类器,得到所述文档文本的实体关系抽取结果。本发明实施例通过上述方法得到实体关系抽取结果,提升文档级别关系抽取的性能,解决了正负样例不均衡的问题,具备更好的处理部分知识缺失的能力,同时具有较好的可扩展性。

    一种基于阅读理解的医学概念编码方法、装置及存储介质

    公开(公告)号:CN113033154A

    公开(公告)日:2021-06-25

    申请号:CN202110597702.2

    申请日:2021-05-31

    Abstract: 本发明公开了一种基于阅读理解的医学概念编码方法、装置及存储介质,通过将临床医疗文本中的医学概念的编码任务转换为阅读理解任务,将临床医疗文本当做阅读理解中的文章,将若干个标准医学术语作为阅读理解中的选项,通过比较选项与选项之间的相关性以及选项与文本之间的相关性,在所述若干个标准医学术语中确定与所述临床医疗文本最相符的目标标准医学术语,并根据所述目标标准医学术语确定所述临床医疗文本的医学编码。本发明可以实现计算机自动为临床医疗文本中的医学概念进行自动编码,解决了现有技术中采用人工编码的方法将临床医疗文本中的医学概念手动映射为医学术语编码,不仅成本高昂、效率有限而且准确性不高的问题。

    一种基于文档结构和外部知识的文档级实体关系抽取方法

    公开(公告)号:CN113032585A

    公开(公告)日:2021-06-25

    申请号:CN202110597525.8

    申请日:2021-05-31

    Abstract: 本发明公开了一种基于文档结构和外部知识的文档级实体关系抽取方法,所述方法包括:获取文档文本,并根据所述文档文本构建文档文本对应的结构图,初始化所述结构图的所述结点和所述边,得到结构图初始化结果;基于结构图、所述结构图初始化结果、经过训练的面向边的图神经网络模型,得到更新后的边,并将所述更新后的边输入分类器,得到所述文档文本的实体关系抽取结果。本发明实施例通过上述方法得到实体关系抽取结果,提升文档级别关系抽取的性能,解决了正负样例不均衡的问题,具备更好的处理部分知识缺失的能力,同时具有较好的可扩展性。

    一种基于阅读理解的医学概念编码方法、装置及存储介质

    公开(公告)号:CN113033154B

    公开(公告)日:2021-08-20

    申请号:CN202110597702.2

    申请日:2021-05-31

    Abstract: 本发明公开了一种基于阅读理解的医学概念编码方法、装置及存储介质,通过将临床医疗文本中的医学概念的编码任务转换为阅读理解任务,将临床医疗文本当做阅读理解中的文章,将若干个标准医学术语作为阅读理解中的选项,通过比较选项与选项之间的相关性以及选项与文本之间的相关性,在所述若干个标准医学术语中确定与所述临床医疗文本最相符的目标标准医学术语,并根据所述目标标准医学术语确定所述临床医疗文本的医学编码。本发明可以实现计算机自动为临床医疗文本中的医学概念进行自动编码,解决了现有技术中采用人工编码的方法将临床医疗文本中的医学概念手动映射为医学术语编码,不仅成本高昂、效率有限而且准确性不高的问题。

    一种复杂医疗实体抽取方法

    公开(公告)号:CN112989835B

    公开(公告)日:2021-10-08

    申请号:CN202110430144.0

    申请日:2021-04-21

    Abstract: 本发明提供了一种复杂医疗实体抽取方法,包括执行以下任一项步骤:抽取单层连续实体和非连续实体步骤:对原始医疗文本进行预处理,采用基于依存分析的非连续实体双向标注方法进行标注,然后建立非连续实体抽取模型并使用双仿射分类器作为解码器,最后将预测标注还原为实体;抽取单层连续实体和嵌套实体步骤:对原始医疗文本进行预处理,采用基于依存分析的嵌套实体双向标注方法进行标注,然后建立嵌套实体抽取模型并使用双仿射分类器作为解码器,最后将预测标注还原为实体;抽取单层连续实体、非连续实体和嵌套实体步骤。本发明的有益效果是:本发明具有充分挖掘文本上下文信息,提高模型泛化性,增强模型对实体的识别准确率等优点。

    一种复杂医疗实体抽取方法

    公开(公告)号:CN112989835A

    公开(公告)日:2021-06-18

    申请号:CN202110430144.0

    申请日:2021-04-21

    Abstract: 本发明提供了一种复杂医疗实体抽取方法,包括执行以下任一项步骤:抽取单层连续实体和非连续实体步骤:对原始医疗文本进行预处理,采用基于依存分析的非连续实体双向标注方法进行标注,然后建立非连续实体抽取模型并使用双仿射分类器作为解码器,最后将预测标注还原为实体;抽取单层连续实体和嵌套实体步骤:对原始医疗文本进行预处理,采用基于依存分析的嵌套实体双向标注方法进行标注,然后建立嵌套实体抽取模型并使用双仿射分类器作为解码器,最后将预测标注还原为实体;抽取单层连续实体、非连续实体和嵌套实体步骤。本发明的有益效果是:本发明具有充分挖掘文本上下文信息,提高模型泛化性,增强模型对实体的识别准确率等优点。

Patent Agency Ranking