-
公开(公告)号:CN113033155B
公开(公告)日:2021-10-26
申请号:CN202110597714.5
申请日:2021-05-31
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/126 , G06F40/247 , G06F40/295 , G06F40/30
Abstract: 本发明公开了提供了一种结合序列生成和层级词表的医学概念自动编码方法及装置,通过将临床医疗文本中的医学概念编码事件转变为序列生成问题,并引入层级词表的概念来增强医疗术语之间的关系,根据所述层级词表在进行序列生成的过程中准确地确定所述临床医疗文本对应的标准医学术语并进行自动编码。解决了现有技术中采用人工编码的方法将临床医疗文本中的医学概念手动映射为标准医学术语编码,不仅成本高昂、效率有限而且准确性不高的问题。
-
公开(公告)号:CN113032585B
公开(公告)日:2021-08-20
申请号:CN202110597525.8
申请日:2021-05-31
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了一种基于文档结构和外部知识的文档级实体关系抽取方法,所述方法包括:获取文档文本,并根据所述文档文本构建文档文本对应的结构图,初始化所述结构图的所述结点和所述边,得到结构图初始化结果;基于结构图、所述结构图初始化结果、经过训练的面向边的图神经网络模型,得到更新后的边,并将所述更新后的边输入分类器,得到所述文档文本的实体关系抽取结果。本发明实施例通过上述方法得到实体关系抽取结果,提升文档级别关系抽取的性能,解决了正负样例不均衡的问题,具备更好的处理部分知识缺失的能力,同时具有较好的可扩展性。
-
公开(公告)号:CN113033155A
公开(公告)日:2021-06-25
申请号:CN202110597714.5
申请日:2021-05-31
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/126 , G06F40/247 , G06F40/295 , G06F40/30
Abstract: 本发明公开了提供了一种结合序列生成和层级词表的医学概念自动编码方法及装置,通过将临床医疗文本中的医学概念编码事件转变为序列生成问题,并引入层级词表的概念来增强医疗术语之间的关系,根据所述层级词表在进行序列生成的过程中准确地确定所述临床医疗文本对应的标准医学术语并进行自动编码。解决了现有技术中采用人工编码的方法将临床医疗文本中的医学概念手动映射为标准医学术语编码,不仅成本高昂、效率有限而且准确性不高的问题。
-
公开(公告)号:CN113033154A
公开(公告)日:2021-06-25
申请号:CN202110597702.2
申请日:2021-05-31
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/126 , G06F40/242 , G06F40/284 , G06F16/35 , G06K9/62 , G16H70/00
Abstract: 本发明公开了一种基于阅读理解的医学概念编码方法、装置及存储介质,通过将临床医疗文本中的医学概念的编码任务转换为阅读理解任务,将临床医疗文本当做阅读理解中的文章,将若干个标准医学术语作为阅读理解中的选项,通过比较选项与选项之间的相关性以及选项与文本之间的相关性,在所述若干个标准医学术语中确定与所述临床医疗文本最相符的目标标准医学术语,并根据所述目标标准医学术语确定所述临床医疗文本的医学编码。本发明可以实现计算机自动为临床医疗文本中的医学概念进行自动编码,解决了现有技术中采用人工编码的方法将临床医疗文本中的医学概念手动映射为医学术语编码,不仅成本高昂、效率有限而且准确性不高的问题。
-
公开(公告)号:CN113032585A
公开(公告)日:2021-06-25
申请号:CN202110597525.8
申请日:2021-05-31
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了一种基于文档结构和外部知识的文档级实体关系抽取方法,所述方法包括:获取文档文本,并根据所述文档文本构建文档文本对应的结构图,初始化所述结构图的所述结点和所述边,得到结构图初始化结果;基于结构图、所述结构图初始化结果、经过训练的面向边的图神经网络模型,得到更新后的边,并将所述更新后的边输入分类器,得到所述文档文本的实体关系抽取结果。本发明实施例通过上述方法得到实体关系抽取结果,提升文档级别关系抽取的性能,解决了正负样例不均衡的问题,具备更好的处理部分知识缺失的能力,同时具有较好的可扩展性。
-
公开(公告)号:CN113033154B
公开(公告)日:2021-08-20
申请号:CN202110597702.2
申请日:2021-05-31
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/126 , G06F40/242 , G06F40/284 , G06F16/35 , G06K9/62 , G16H70/00
Abstract: 本发明公开了一种基于阅读理解的医学概念编码方法、装置及存储介质,通过将临床医疗文本中的医学概念的编码任务转换为阅读理解任务,将临床医疗文本当做阅读理解中的文章,将若干个标准医学术语作为阅读理解中的选项,通过比较选项与选项之间的相关性以及选项与文本之间的相关性,在所述若干个标准医学术语中确定与所述临床医疗文本最相符的目标标准医学术语,并根据所述目标标准医学术语确定所述临床医疗文本的医学编码。本发明可以实现计算机自动为临床医疗文本中的医学概念进行自动编码,解决了现有技术中采用人工编码的方法将临床医疗文本中的医学概念手动映射为医学术语编码,不仅成本高昂、效率有限而且准确性不高的问题。
-
公开(公告)号:CN112989835B
公开(公告)日:2021-10-08
申请号:CN202110430144.0
申请日:2021-04-21
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/295 , G06N3/04
Abstract: 本发明提供了一种复杂医疗实体抽取方法,包括执行以下任一项步骤:抽取单层连续实体和非连续实体步骤:对原始医疗文本进行预处理,采用基于依存分析的非连续实体双向标注方法进行标注,然后建立非连续实体抽取模型并使用双仿射分类器作为解码器,最后将预测标注还原为实体;抽取单层连续实体和嵌套实体步骤:对原始医疗文本进行预处理,采用基于依存分析的嵌套实体双向标注方法进行标注,然后建立嵌套实体抽取模型并使用双仿射分类器作为解码器,最后将预测标注还原为实体;抽取单层连续实体、非连续实体和嵌套实体步骤。本发明的有益效果是:本发明具有充分挖掘文本上下文信息,提高模型泛化性,增强模型对实体的识别准确率等优点。
-
公开(公告)号:CN113033210A
公开(公告)日:2021-06-25
申请号:CN202110596995.2
申请日:2021-05-31
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/295 , G06F40/242 , G06F40/216 , G06K9/62 , G16H70/40
Abstract: 本发明公开了一种基于社交媒体数据分析的药物潜在副作用挖掘方法,所述方法包括:获取社交媒体的药物评论数据并对所述药物评论数据进行数据预处理,得到药物评论预处理数据,再基于经过训练的BERT语言模型识别所述药物评论预处理数据的药物副作用实体;基于排序的实体标准化方式将所述药物副作用实体映射到标准副作用概念词典,得到初始药物副作用概念;根据所述初始药物副作用概念和官方报告药物副作用概念,得到潜在药物副作用概念。本发明实施例通过上述方法通过对广大民众最真实的用药体验进行分析,可以得到药物更加全面的潜在副作用信息。
-
公开(公告)号:CN112989835A
公开(公告)日:2021-06-18
申请号:CN202110430144.0
申请日:2021-04-21
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/295 , G06N3/04
Abstract: 本发明提供了一种复杂医疗实体抽取方法,包括执行以下任一项步骤:抽取单层连续实体和非连续实体步骤:对原始医疗文本进行预处理,采用基于依存分析的非连续实体双向标注方法进行标注,然后建立非连续实体抽取模型并使用双仿射分类器作为解码器,最后将预测标注还原为实体;抽取单层连续实体和嵌套实体步骤:对原始医疗文本进行预处理,采用基于依存分析的嵌套实体双向标注方法进行标注,然后建立嵌套实体抽取模型并使用双仿射分类器作为解码器,最后将预测标注还原为实体;抽取单层连续实体、非连续实体和嵌套实体步骤。本发明的有益效果是:本发明具有充分挖掘文本上下文信息,提高模型泛化性,增强模型对实体的识别准确率等优点。
-
-
-
-
-
-
-
-