-
公开(公告)号:CN116842455A
公开(公告)日:2023-10-03
申请号:CN202310685368.5
申请日:2023-06-09
Applicant: 西南交通大学
IPC: G06F18/2411 , G06N3/0464 , G06N3/08 , G06F18/2413 , G16H10/60
Abstract: 本发明公开了一种基于最邻近对比学习的小样本编码方法,利用卷积神经网络和ICD编码描述捕捉文本语义特征,并利用注意力机制以捕获到与ICD信息关系密切相关的病历文本内容,使用额外的结构化知识的统一医学语言系统和ICD编码的树形层次结构来构建对比学习的正负样本,进而训练了一个针对同一个编码不同表述的自CMCL模型,使得同义表述和其缩写的特征表示在特征空间中更接近,不同编码的表述在特征空间中距离更远。最后利用k邻近模块整合训练集中已有知识获得最佳预测结果。
-
公开(公告)号:CN114528944A
公开(公告)日:2022-05-24
申请号:CN202210169875.9
申请日:2022-02-24
Applicant: 西南交通大学
IPC: G06K9/62 , G06N3/04 , G06N3/08 , G06F40/30 , G06F40/284 , G06F40/211
Abstract: 本发明提供了一种医疗文本编码方法、装置、设备及可读存储介质,所述方法包括:获取第一文档集合;基于临床文档,利用词嵌入技术生成词嵌入矩阵;基于临床文档、词嵌入矩阵和卷积神经网络得到上层序列向量;基于上层序列向量和词嵌入矩阵得到每个临床文档所对应的句子向量;基于每个临床文档所对应的句子向量得到初步的分类器;基于第一文档集合和临床文档所对应的句子向量得到最终的分类器,使用最终的分类器对临床文档进行ICD编码。本发明关注了罕见疾病编码,提高了编码员对罕见病的重视。并且本发明能够自动抽取特征,不依赖手工特征,对不同医生的书写风格进行了缓和,可以减少研究时间和减少匹配错误。
-
公开(公告)号:CN114528944B
公开(公告)日:2023-08-01
申请号:CN202210169875.9
申请日:2022-02-24
Applicant: 西南交通大学
IPC: G06F40/126 , G06F16/35 , G06N3/0464 , G06N3/08 , G06F40/30 , G06F40/284 , G06F40/211
Abstract: 本发明提供了一种医疗文本编码方法、装置、设备及可读存储介质,所述方法包括:获取第一文档集合;基于临床文档,利用词嵌入技术生成词嵌入矩阵;基于临床文档、词嵌入矩阵和卷积神经网络得到上层序列向量;基于上层序列向量和词嵌入矩阵得到每个临床文档所对应的句子向量;基于每个临床文档所对应的句子向量得到初步的分类器;基于第一文档集合和临床文档所对应的句子向量得到最终的分类器,使用最终的分类器对临床文档进行ICD编码。本发明关注了罕见疾病编码,提高了编码员对罕见病的重视。并且本发明能够自动抽取特征,不依赖手工特征,对不同医生的书写风格进行了缓和,可以减少研究时间和减少匹配错误。
-
-