-
公开(公告)号:CN114023412B
公开(公告)日:2024-06-21
申请号:CN202111396853.8
申请日:2021-11-23
Applicant: 大连海事大学
IPC: G16H10/60 , G06Q10/04 , G06F18/213 , G06N3/0442 , G06N3/0499 , G06N3/098 , G06F40/30
Abstract: 本发明公开了一种基于联合学习和去噪机制的ICD代码预测方法及系统,涉及自然语言处理技术领域,使用clinicalBERT预训练,设计了基于提示的微调方法,提升冗长句子的表征效果,加快预训练的速度;使用双路注意力机制处理电子病历和医疗代码的文档,同时兼顾两部分数据,有效处理不平衡分类问题;将不同的注意力矩阵馈送到联合学习模块,引入两个权重系数,来自适应的确定这两个系数,通过这两个系数构建特定于ICD的注意力矩阵;设计了新型的去噪损失函数,引入损失阈值,计算样本损失,并进行排序,从超过阈值的样本开始截断,丢弃迭代过程中超过动态阈值的样本,最终识别和清洗嘈杂的样本,提高分类器的训练质量。
-
公开(公告)号:CN114023412A
公开(公告)日:2022-02-08
申请号:CN202111396853.8
申请日:2021-11-23
Applicant: 大连海事大学
Abstract: 本发明公开了一种基于联合学习和去噪机制的ICD代码预测方法及系统,涉及自然语言处理技术领域,使用clinicalBERT预训练,设计了基于提示的微调方法,提升冗长句子的表征效果,加快预训练的速度;使用双路注意力机制处理电子病历和医疗代码的文档,同时兼顾两部分数据,有效处理不平衡分类问题;将不同的注意力矩阵馈送到联合学习模块,引入两个权重系数,来自适应的确定这两个系数,通过这两个系数构建特定于ICD的注意力矩阵;设计了新型的去噪损失函数,引入损失阈值,计算样本损失,并进行排序,从超过阈值的样本开始截断,丢弃迭代过程中超过动态阈值的样本,最终识别和清洗嘈杂的样本,提高分类器的训练质量。
-
公开(公告)号:CN117494049A
公开(公告)日:2024-02-02
申请号:CN202311515917.0
申请日:2023-11-13
Applicant: 大连海事大学
IPC: G06F18/25 , G06N3/0442 , G06N3/098 , G06N5/022 , G06F18/243 , G06F40/289
Abstract: 本发明提出了一种基于特征交互和多模态知识融合的医学代码预测方法及系统,属于自然语言处理技术领域。本发明提出了一个新的联合学习框架,探索表格数据和临床笔记之间的相互依赖,以生成包含两者之间关联的表示。本发明提出一个多模态知识融合网络,将维基百科知识、表格数据、临床笔记进行融合,以提取不同类型数据之间的互补性信息。通过知识融合,不仅可以快速更好地融合不同数据的特征,还可以兼顾临床笔记和ICD代码两部分的数据特征,提升了模型的预测性能。本发明是本领域首次同时结合维基百科知识和结构化表格数据来辅助ICD编码任务并且达到很好的预测效果,有效地处理了代码之间的关联性和文本中的噪声问题。
-
-