-
公开(公告)号:CN113204970A
公开(公告)日:2021-08-03
申请号:CN202110631994.7
申请日:2021-06-07
Applicant: 吉林大学
IPC: G06F40/295 , G06F40/30 , G06F40/58 , G06F16/35 , G06F16/383 , G06N3/04 , G06N3/08
Abstract: 本发明公开的属于命名实体识别技术领域,具体为一种BERT‑BiLSTM‑CRF命名实体检测模型,其包括:IDCNN‑CRF命名实体识别模型和BERT‑BiLSTM‑CRF命名实体识别模型,IDCNN‑CRF命名实体识别模型架构如下:Embdding层为词向量层,用于将输入数据处理成词向量再送入模型,采用分布式向量表示Word2Vec;IDCNN层,用于将embedding层处理好的字向量或者词向量送入到IDCNN层,经过膨胀卷积神经网络的膨胀卷积操作,对输入的字向量重新计算,得到新的向量表示。该BERT‑BiLSTM‑CRF命名实体检测模型及装置,以BiLSTM‑CRF模型为基准,使用北京大学标注好的《人民日报》数据集和微软亚研院MSRA命名实体识别数据集,构建了IDCNN‑CRF模型以及BERT‑BiLSTM‑CRF模型,提高了命名实体识别的准确度以及运行效率,缩短了模型训练时间。