-
公开(公告)号:CN118607523A
公开(公告)日:2024-09-06
申请号:CN202410332692.3
申请日:2024-03-22
Applicant: 重庆邮电大学
IPC: G06F40/295 , G06N3/044 , G06N3/08 , G06F16/33
Abstract: 本发明属于命名实体识别领域,具体涉及一种用于中文医疗嵌套命名的实体识别方法,包括:获取公开数据集,对公开数据集进行预处理;采用循环神经网络RNN对预处理后的数据进行处理,得到翻译数据;获取原始文本句子集合,构建类别标签信息;将句子和类别标签信息分别输入到编码器中,得到标签信息向量表示和句子向量表示;将翻译数据输入到Bert模型中,得到增强的词汇表;分别对句子向量表示和标签信息向量表示进行预处理;对预处理后的句子向量表示进行词汇增强;将增强后的句子向量表示与标签信息向量表示进行拼接融合,将融合后的向量表示输入到实体识别模型中,得到实体的识别结果;本发明引入不同类别的知识,解决了嵌套实体识别问题。