发明公开
- 专利标题: 一种电力语料标记模型构建方法及系统
-
申请号: CN202010547313.4申请日: 2020-06-16
-
公开(公告)号: CN111831788A公开(公告)日: 2020-10-27
- 发明人: 田然 , 苏杨 , 庞渊源 , 陈轩 , 顾彬 , 王磊 , 吴子辰 , 李霁轩 , 陈鑫 , 朱晓鸿 , 王鑫 , 于广荣
- 申请人: 国网江苏省电力有限公司信息通信分公司
- 申请人地址: 江苏省南京市北京西路20号
- 专利权人: 国网江苏省电力有限公司信息通信分公司
- 当前专利权人: 国网江苏省电力有限公司信息通信分公司
- 当前专利权人地址: 江苏省南京市北京西路20号
- 代理机构: 南京纵横知识产权代理有限公司
- 代理商 史俊军
- 主分类号: G06F16/33
- IPC分类号: G06F16/33 ; G06F40/247 ; G06F40/279 ; G06K9/62
摘要:
本发明公开了一种电力语料标记模型构建方法,包括对训练集中的已标记电力语料进行扩展,训练初始的标记模型;判断训练的标记模型是否满足预设要求,若不满足预设要求,用该标记模型对未标记的电力语料进行标记,并将标记后的电力语料放入训练集,对训练集中的已标记电力语料进行扩展,重新训练标记模型,重复该步骤,直到训练的标记模型满足预设要求。同时公开了相应的系统。本发明对训练集中的已标记电力语料进行扩展,用不满足预设要求的标记模型标记电力语料,并将标记后的电力语料加入训练集,采用滚雪球的方式扩大训练集,大大减少人工成本。