基于关系抽取的能源文本数据结构化方法及装置

    公开(公告)号:CN116383339A

    公开(公告)日:2023-07-04

    申请号:CN202310075137.2

    申请日:2023-01-31

    Abstract: 本申请公开了一种基于关系抽取的能源文本数据结构化方法及装置,通过获取第一能源文本数据集,提取第一能源文本数据集中的能源文本数据的实体特征,并建立能源文本数据之间的实体关系,得到第二能源文本数据集;基于能源文本数据的能源类型,对第二能源文本数据集中的能源文本数据进行数据增强,得到第三能源文本数据集;基于第三能源文本数据集,对预设神经网络模型进行迭代训练,直至预设神经网络模型达到预设收敛条件,得到数据结构化模型,利用数据结构化模型,对待结构化能源文本数据进行结构化,生成结构化数据报表。提高能源了文本数据的分类准确性、可分析性和存储便利性,有效解决传统文本数据结构化方法在能源领域的局限性。

Patent Agency Ranking