-
公开(公告)号:CN114417836B
公开(公告)日:2025-02-11
申请号:CN202210052863.8
申请日:2022-01-18
Applicant: 北京工业大学
IPC: G06F40/242 , G06F40/30 , G16H10/60 , G06N3/0455
Abstract: 本发明公开了一种基于深度学习的中文电子病历文本语义分割方法,主要包括语义字典构建及文本语义特征向量表示、整体特征融合、深度神经网络训练以及预测优化部分。利用预训练语言模型表示文本上下文语义特征,并加入了字符语义位置特征,将融合后的整体特征输入到深度神经网络中进行模型训练。相比于现有的语义分割技术,本发明构建字符间融合全局的上下文语义特征,捕获并学习序列每个字符的语义类别特性,最后找到每个字符的最佳语义类别标签,从而实现精细化的文本语义分割,在数据集较小情况下实现了文本语义分割较高的准确性,发展了EMR文本语义分割的新方法。
-
公开(公告)号:CN114417836A
公开(公告)日:2022-04-29
申请号:CN202210052863.8
申请日:2022-01-18
Applicant: 北京工业大学
IPC: G06F40/242 , G06F40/30 , G16H10/60 , G06N3/04
Abstract: 本发明公开了一种基于深度学习的中文电子病历文本语义分割方法,主要包括语义字典构建及文本语义特征向量表示、整体特征融合、深度神经网络训练以及预测优化部分。利用预训练语言模型表示文本上下文语义特征,并加入了字符语义位置特征,将融合后的整体特征输入到深度神经网络中进行模型训练。相比于现有的语义分割技术,本发明构建字符间融合全局的上下文语义特征,捕获并学习序列每个字符的语义类别特性,最后找到每个字符的最佳语义类别标签,从而实现精细化的文本语义分割,在数据集较小情况下实现了文本语义分割较高的准确性,发展了EMR文本语义分割的新方法。
-