-
公开(公告)号:CN117828105A
公开(公告)日:2024-04-05
申请号:CN202410100913.4
申请日:2024-01-23
Applicant: 三峡大学
IPC: G06F16/36 , G06N5/02 , G06F18/24 , G06F18/25 , G06F40/30 , G06F40/295 , G06N3/0442 , G06N3/045 , G06N3/048 , G06N3/08 , G06Q50/06
Abstract: 本发明公开了一种基于联合抽取的电力缺陷文本知识图谱构建方法,该方法首先构建电力缺陷领域的联合标注体系,通过包含实体标签和关系标签的统一标注集,对文本进行标注,以识别出文本中的所有实体及实体对关系;该方法通过构建融合BERT、全连接层、双向长短期记忆网络和条件随机场的实体关系抽取模型,通过性能对比得出引入全连接层可较好提高模型性能,能捕捉重叠关系中的实际结构信息,对比其他三个模型,能更精细地表示电力缺陷实体在不同关系中的语义角色,便于后续下游任务利用结构化信息,为后续的知识图谱构建了良好的基础。
-
公开(公告)号:CN117829138A
公开(公告)日:2024-04-05
申请号:CN202311634610.2
申请日:2023-11-29
Applicant: 三峡大学 , 国网湖北省电力有限公司宜昌供电公司
IPC: G06F40/279 , G06F40/30 , G06F16/31 , G06F16/35 , G06N3/0442 , G06N3/045 , G06N3/0499 , G06N7/01 , G06N5/022 , G06Q10/20 , G06Q50/06
Abstract: 本发明公开了一种基于深度学习的电力缺陷实体识别方法,通过提出融合基于全词掩码的预训练模型BERT与注意力机制的电力缺陷文本识别模型,通过BERT‑WWM模型生成上下文信息丰富的词向量表示,之后通过BiLSTM层和Attention层对这些词向量进行处理,最后利用CRF层进行序列标注;本方案解决了现有技术模型对电力专业文本及关键词和上下文理解能力较弱,需要手动构建词典,需要大量专业知识,依赖人工手动添加的问题,可以有效避免因字级别的遮罩而导致的模型学习偏差,提高处理复杂电力专业词汇时模型理解能力,并捕获各电力实体间复杂的依赖关系。
-