-
公开(公告)号:CN117313726A
公开(公告)日:2023-12-29
申请号:CN202310978639.6
申请日:2023-08-04
Applicant: 北京交通大学
IPC: G06F40/295 , G06F40/30 , G06N5/025 , G06N20/00 , G06F18/24 , G06F40/126 , G06F18/214
Abstract: 本发明提供了一种基于联邦对比增强的异质临床病历实体抽取方法。该方法包括:各个客户端利用本地的病历数据集上对全局编码器和本地编码器进行对比学习训练,在每个客户端保存训练好的全局编码器和本地编码器;将待识别的病历文本的嵌入向量表示输入到客户端上训练好的全局编码器和本地编码器,全局编码器和本地编码器分别对病历文本的嵌入向量表示进行编码,将全局编码器和本地编码器的编码结果拼接后输入到全连接网络,再通过CRF解码器,得到所述待识别的病历文本的序列标签预测结果。本发明方法针对标签异质导致的模型结构不同,只对编码器进行联邦建模;可以在跨病种和标签异质的多机构场景下进行联邦建模,以实现有效地对病历进行标签分类。