一种电力行业实体关系抽取方法、装置、设备及介质
摘要:
本发明公开一种电力行业实体关系抽取方法、装置、设备及介质,方法包括:获取电力行业文本数据集并进行预处理,基于电力行业实体查询模板,利用生成式预训练语言模型提取电力行业实体,构建标注实体数据集;利用ELMO模型和Transformer‑CRF模型对电力行业文本数据集进行上下文特征提取和序列标注,建模得到全局依赖关系;基于全局依赖关系,对待标注文本数据进行上下文特征提取和序列标注,获得实体标签序列,将其中连续且相同的实体标签合并,确定若干实体;基于实体关系查询模板,利用生成式预训练语言模型提取关系信息,并按照预设匹配规则对若干实体构造关系实例。本发明能够提高电力行业实体关系抽取的准确性和覆盖度。
0/0