发明公开
- 专利标题: 一种基于Bert的面向非结构化电力数据的知识抽取方法及系统
-
申请号: CN202210754571.9申请日: 2022-06-29
-
公开(公告)号: CN114996408A公开(公告)日: 2022-09-02
- 发明人: 王移兵 , 艾冰 , 江丽娜 , 季良 , 王婷 , 张晓宇 , 贾崟 , 张壁君 , 高珊
- 申请人: 国家电网有限公司大数据中心
- 申请人地址: 北京市西城区白广路二条一号综合楼330房间
- 专利权人: 国家电网有限公司大数据中心
- 当前专利权人: 国家电网有限公司大数据中心
- 当前专利权人地址: 北京市西城区白广路二条一号综合楼330房间
- 代理机构: 郑州欧凯专利代理事务所
- 代理商 王林华
- 主分类号: G06F16/33
- IPC分类号: G06F16/33 ; G06F16/35 ; G06F40/211 ; G06F40/295 ; G06K9/62 ; G06N3/04 ; G06N3/08 ; G06N5/02
摘要:
本发明属于电力数据处理技术领域,尤其为一种基于Bert的面向非结构化电力数据的知识抽取方法及系统,该方法中,对触发词明显、句式和位置相对固定的知识,使用正则匹配方法抽取知识实体,对于非结构化电力数据中存在实体界限模糊和实体嵌套问题,通过基于Bert的知识抽取方法来抽取知识实体,然后再利用实体抽取的结果使用基于Bert的预训练语言模型进行关系和属性抽取,最终实现对非结构化电力数据的知识抽取,充分考虑了非结构化电力数据的句式和结构,适于非结构化电力数据的知识抽取,属于一种深度学习的知识抽取方法,而深度学习方法可以自动学习特征,采用低维、稠密的实值向量表示数据,避免了对人工和专家知识的严重依赖。