-
公开(公告)号:CN114564959A
公开(公告)日:2022-05-31
申请号:CN202210041524.X
申请日:2022-01-14
Applicant: 北京交通大学
IPC: G06F40/295 , G06K9/62 , G06N3/04 , G16H10/60
Abstract: 本发明提供一种基于中文临床表型细粒度命名实体识别方法及系统,属于临床病历信息处理技术领域,通过自然语言预训练模型BERT进行临床文本的字符级嵌入特征抽取;利用双向长短词记忆模型BiLSTM对字符级嵌入特征和临床文本的序列特征进行整合并进行特征编码,得到标签;利用条件随机场CRF进行标签的解码预测,得到命名实体识别结果。本发明建立了用于细粒度命名实体实验的临床细粒度表型实体标准数据集,其区分了阴性症状和阳性症状,为临床分析提供更为精确的结构化数据。
-
公开(公告)号:CN114564959B
公开(公告)日:2024-07-05
申请号:CN202210041524.X
申请日:2022-01-14
Applicant: 北京交通大学
IPC: G06F40/295 , G06F18/214 , G06N3/047 , G06N3/084 , G06N3/0455 , G06N3/09 , G16H10/60
Abstract: 本发明提供一种基于中文临床表型细粒度命名实体识别方法及系统,属于临床病历信息处理技术领域,通过自然语言预训练模型BERT进行临床文本的字符级嵌入特征抽取;利用双向长短词记忆模型BiLSTM对字符级嵌入特征和临床文本的序列特征进行整合并进行特征编码,得到标签;利用条件随机场CRF进行标签的解码预测,得到命名实体识别结果。本发明建立了用于细粒度命名实体实验的临床细粒度表型实体标准数据集,其区分了阴性症状和阳性症状,为临床分析提供更为精确的结构化数据。
-