-
公开(公告)号:CN116383339A
公开(公告)日:2023-07-04
申请号:CN202310075137.2
申请日:2023-01-31
Applicant: 广东电网有限责任公司
IPC: G06F16/33 , G06F16/35 , G06F16/951 , G06F40/279 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种基于关系抽取的能源文本数据结构化方法及装置,通过获取第一能源文本数据集,提取第一能源文本数据集中的能源文本数据的实体特征,并建立能源文本数据之间的实体关系,得到第二能源文本数据集;基于能源文本数据的能源类型,对第二能源文本数据集中的能源文本数据进行数据增强,得到第三能源文本数据集;基于第三能源文本数据集,对预设神经网络模型进行迭代训练,直至预设神经网络模型达到预设收敛条件,得到数据结构化模型,利用数据结构化模型,对待结构化能源文本数据进行结构化,生成结构化数据报表。提高能源了文本数据的分类准确性、可分析性和存储便利性,有效解决传统文本数据结构化方法在能源领域的局限性。