一种BERT-BiLSTM-CRF命名实体检测模型及装置

    公开(公告)号:CN113204970A

    公开(公告)日:2021-08-03

    申请号:CN202110631994.7

    申请日:2021-06-07

    Applicant: 吉林大学

    Abstract: 本发明公开的属于命名实体识别技术领域,具体为一种BERT‑BiLSTM‑CRF命名实体检测模型,其包括:IDCNN‑CRF命名实体识别模型和BERT‑BiLSTM‑CRF命名实体识别模型,IDCNN‑CRF命名实体识别模型架构如下:Embdding层为词向量层,用于将输入数据处理成词向量再送入模型,采用分布式向量表示Word2Vec;IDCNN层,用于将embedding层处理好的字向量或者词向量送入到IDCNN层,经过膨胀卷积神经网络的膨胀卷积操作,对输入的字向量重新计算,得到新的向量表示。该BERT‑BiLSTM‑CRF命名实体检测模型及装置,以BiLSTM‑CRF模型为基准,使用北京大学标注好的《人民日报》数据集和微软亚研院MSRA命名实体识别数据集,构建了IDCNN‑CRF模型以及BERT‑BiLSTM‑CRF模型,提高了命名实体识别的准确度以及运行效率,缩短了模型训练时间。

Patent Agency Ranking