-
公开(公告)号:CN114722216B
公开(公告)日:2025-03-18
申请号:CN202210413638.2
申请日:2022-04-15
Applicant: 大连理工大学
IPC: G06F16/36 , G16H10/60 , G06N5/022 , G06N3/0442 , G06N3/042 , G06N3/048 , G06N3/09 , G06F18/2413 , G06F18/214
Abstract: 本发明提出一种基于中文电子病历知识图谱的实体对齐方法。该方法包括:构建训练集和测试集,在异构医学知识图谱上构建用于实体对齐的训练集和测试集;利用规则对医学知识图谱进行推理,补全缺失的关系,缓解医学知识图谱之间的结构异质性;构建基于门控机制的双视角图神经网络模型,旨在对异构医疗知识图谱进行对齐与融合,在兼顾准确率和人工成本的基础上,Hits@5的准确率高达85.4%,有效的整合现有的医疗资源,推动智慧医疗的发展。
-
公开(公告)号:CN115017910B
公开(公告)日:2024-10-25
申请号:CN202210749641.1
申请日:2022-06-29
Applicant: 大连理工大学
IPC: G06F40/295 , G06F16/35 , G06N3/045 , G06N3/0464 , G06N3/0442 , G06N3/048 , G06N3/084 , G16H10/60 , G16H50/70
Abstract: 基于中文电子病历的实体关系联合抽取方法、网络、设备和计算机可读存储介质,属于自然语言处理领域,解决无法充分捕获远距离上下文语义信息以及实体识别和关系抽取信息交互不足的问题,要点是通过将句子的实体任务特征与双向时序特征通过协同注意力网络获取深度融合特征,并将融合特征通过多层卷积,获取关系抽取特征;获取实体任务特征,实体任务特征经过条件随机场得到实体标记序列;通过所述实体标记序列,对所得实体两两配对得到多个实体对;根据所述关系抽取特征对各实体的对应位置的特征加权、平均操作得到实体的特征;将实体对的两个实体对应的实体的特征与预训练模型的句子表示拼接,通过分类器输出根据所述拼接表示得到的实体关系类型,效果是提高了实体关系抽取的精度。
-
公开(公告)号:CN117436521A
公开(公告)日:2024-01-23
申请号:CN202311563992.4
申请日:2023-11-22
Applicant: 大连理工大学
Abstract: 自动构建生物医学领域大规模事件关系语料的方法及语料库,属于自然语言处理领域,为了解决在生物医学领域自动标注大规模的事件关系语料的问题,要点是S10.由生物医学文本得到生物实体及事件关系;S20.定义要素路径,构建触发词语义匹配模板;S30.根据关键要素路径比例,计算关键要素路径集合;S40.根据所述触发词匹配率,由所述触发词语义匹配模板中的语义类型中,选取关键要素路径覆盖比例最高的语义类型,为当前触发词对匹配的事件关系,用于在生物医学领域自动标注大规模的事件关系语料。
-
公开(公告)号:CN109492227A
公开(公告)日:2019-03-19
申请号:CN201811365160.0
申请日:2018-11-16
Applicant: 大连理工大学
IPC: G06F17/27
Abstract: 本发明提供了一种基于多头注意力机制和动态迭代的机器阅读理解方法,属于自然语言处理领域。机器阅读理解模型构建方法如下:构建文章和问题编码层;构建基于双向注意力流的循环神经网络;构建自注意力层以及基于动态迭代解码器预测答案输出。本发明方法可以针对机器阅读理解任务文本中的问题进行答案预测;本发明建立了一个新的端到端的神经网络模型,为机器阅读理解任务的探索提供了一种新思路。
-
公开(公告)号:CN107818141A
公开(公告)日:2018-03-20
申请号:CN201710933832.2
申请日:2017-10-10
Applicant: 大连理工大学
IPC: G06F17/30
Abstract: 本发明提供了一种融入结构化要素识别的生物医学事件抽取方法,属于生物医学信息抽取技术领域。生物医学事件抽取方法如下:基于PA在线学习算法分类的触发词识别、基于Viterbi算法和PA在线学习算法的结构化要素识别以及基于双分解原理的联合事件抽取方法。使用本发明可以对大量的生物医学文献进行触发词识别、要素识别和双分解操作来抽取生物医学事件;本发明加入了词向量和丰富而且有效的特征,提高了触发词和要素识别性能;使用结构化要素识别,提高了复杂事件抽取的精度;使用联合事件抽取系统,解决分阶段系统的级联错误。
-
公开(公告)号:CN111859935B
公开(公告)日:2022-09-20
申请号:CN202010629395.7
申请日:2020-07-03
Applicant: 大连理工大学
IPC: G06F40/279 , G06F16/31 , G06N20/00
Abstract: 本发明属于自然语言处理技术领域,提供了基于文献的癌症相关生物医学事件数据库构建方法,由三大部分组成:1、基于实体关系图的生物医学实体及实体关系联合抽取;2、基于分层蒸馏网络的生物医学事件抽取;3、癌症相关的生物医学事件数据库构建。在传统方法的基础上充分考虑生物医学文本中实体本身和上下文的特点,解决了生物医学事件抽取中存在的多类型实体识别及实体识别不完整的问题,并基于分层蒸馏网络获取更深层次的句法信息对生物医学事件进行抽取,提高复杂事件抽取的精度,能够帮助生物医学领域研究者对文本进行自动分析,可以提供对已知生物医学命名实体和生物医学事件检索的功能,帮助他们对生物医学相关文献进行研究和分析。
-
公开(公告)号:CN111078889A
公开(公告)日:2020-04-28
申请号:CN201911330114.1
申请日:2019-12-20
Applicant: 大连理工大学
IPC: G06F16/35 , G06F40/30 , G06F40/166 , G16H70/40
Abstract: 本发明属于计算机自然语言处理技术领域,提供了一种基于多种实体注意力和改进预训练语言模型的药物间关系抽取方法。在神经网络之中利用多种不同的实体注意力机制,来增强神经网络对复杂药物名的理解,其中实体注意力机制包括:实体标记注意力、两实体标记差注意力和基于实体描述文档的注意力机制,同时对预训练语言模型的输入进行改进,使得其输出能够更好的适用于药物间关系抽取任务。本发明的益处是解决了在处理药物关系描述文档时,药物名过于复杂而导致深度学习模型无法很好地理解药物名的难题,提高了药物关系识别水平。
-
公开(公告)号:CN108628970A
公开(公告)日:2018-10-09
申请号:CN201810375882.8
申请日:2018-04-17
Applicant: 大连理工大学
Abstract: 本发明属于自然语言处理技术领域,涉及一种基于新标记模式的生物医学事件联合抽取方法。本发明包括生物医学事件联合抽取过程中触发词和要素的新标记方法、基于LSTM深度学习网络进行触发词和要素的同时识别、以及基于SVM分类器处理生成事件的生物医学事件联合抽取方法。使本发明可以从原始的生物医学语料中抽取出已定义的9类生物医学事件,抽取过程结合深度学习的方法,减少了人工进行特征选取的工作;本发明为生物医学事件联合抽取提供一种新的触发词和要素的标记方法。
-
公开(公告)号:CN117436522A
公开(公告)日:2024-01-23
申请号:CN202311563994.3
申请日:2023-11-22
Applicant: 大连理工大学
IPC: G06N5/025 , G06F18/24 , G06N3/0455
Abstract: 生物事件关系抽取方法及癌症主题的大规模生物事件关系知识库构建方法,属于自然语言处理领域,为了解决生物事件关系抽取任务中类别不平衡的问题,要点是S10.对于类别不平衡数据集,训练基于提示学习的数据生成模型,生成小类样本数据;S20.通过基于原型网络的分类模型,对所述数据生成模型生成的小类样本数据进行筛选,筛选保留的小类样本数据补充进类别不平衡数据集中生成增强数据集;S30.使用增强数据集进行事件关系抽取模型训练,由训练后的事件关系抽取模型对生物事件关系进行分类,用于缓解已有研究无法充分解决类别不平衡问题对生物事件关系抽取性能的影响。
-
公开(公告)号:CN109446326B
公开(公告)日:2021-04-20
申请号:CN201811291947.7
申请日:2018-11-01
Applicant: 大连理工大学
IPC: G06F16/35 , G06F16/36 , G06F40/30 , G06F40/289 , G06K9/62
Abstract: 本发明提供了一种基于复制机制的生物医学事件抽取方法,属于自然语言处理技术领域。基于复制机制的生物医学事件抽取方法步骤如下:构造模型输入向量;构造使用双向LSTM模型的Encoder模块;构造基于Attention机制和复制机制的同时识别触发词和要素的Decoder模块。使用本发明可以有效避免分阶段方法带来的级联错误和子任务之间相互独立的缺点,以及联合模型中单纯使用共享参数而导致的误差传递,提高生物医学事件抽取的性能。
-
-
-
-
-
-
-
-
-