一种配电网故障文本实体识别方法

    公开(公告)号:CN118569252A

    公开(公告)日:2024-08-30

    申请号:CN202410647533.2

    申请日:2024-05-23

    摘要: 本发明公开了一种配电网故障文本实体识别方法,属于文本实体识别技术领域。配电网故障文本实体识别方法包括以下步骤:采用SpanBERT对原始获得的配电网故障文本数据进行训练,获得配电网领域SpanBERT模型;采用配电网领域SpanBERT模型对经过基于字典匹配自动构建标注的配电网故障文本数据和原始获得的配电网故障文本数据进行联合训练得到特征向量;将特征向量和经过双向长短期记忆网络处理得到的拼音向量进行融合得到多特征融合向量;提出新的打分函数对现有的仿射网络进行了改进,进行实体识别。本发明采用上述配电网故障文本实体识别方法,解决了依赖于大量的标注数据进行训练、嵌套的命名实体识别以及非连续的命名实体识别困难和指代消解的问题。