一种基于文本分类的电力领域表格列标注方法

    公开(公告)号:CN113486177A

    公开(公告)日:2021-10-08

    申请号:CN202110782328.3

    申请日:2021-07-12

    摘要: 本发明公开了一种基于文本分类的电力领域表格列标注方法,它包括:步骤1、采集电力领域相关表格文本语料,对于表格中的每一行,从该行中提取实体或句子,利用搜索引擎搜索该实体,获取该实体对应的搜索结果;步骤2、从搜索结果条目中抽取锚文本形成摘要,并用电力领域关键词库进行过滤,过滤掉不包含电力领域关键词的摘要,从而组成该单元格内容要素的上下文;步骤3、将单元格的上下文输入到基于预训练模型分类器中,获得该单元格要素属于的类别,并分类标注;步骤4、对于表格中的一列,根据列中单元格内容元素所属类别,确定该列的列标签;解决了现有技术对电力领域表格列标注存在较大的局限性等技术问题。

    一种基于文本分类的电力系统调度员等级评估系统

    公开(公告)号:CN113487194A

    公开(公告)日:2021-10-08

    申请号:CN202110782336.8

    申请日:2021-07-12

    摘要: 本发明公开了一种基于文本分类的电力系统调度员等级评估系统,它包括:数据采集模块:从数据库系统采集调度员文本数据资料,构建训练数据集;数据预处理模块:对采集的调度员文本数据资料进行预处理;模型训练微调模块:使用预训练模型BERT对预处理后的文本信息进行文本表示数字化,在BERT模型后连接构建1层的全连接网络,基于训练数据集进行模型训练和微调获得分类模型;能力水平等级预测模块:在测试集上对基于预训练模型BERT的分类模型进行评分以检验效果;解决了现有技术针对电力系统调度员等级评估耗费大量人力物力且效率低下,同时当前基于分类的方法准确率不高等技术问题。

    一种基于文本分类的电力系统调度员等级评估系统

    公开(公告)号:CN113487194B

    公开(公告)日:2023-11-07

    申请号:CN202110782336.8

    申请日:2021-07-12

    摘要: 本发明公开了一种基于文本分类的电力系统调度员等级评估系统,它包括:数据采集模块:从数据库系统采集调度员文本数据资料,构建训练数据集;数据预处理模块:对采集的调度员文本数据资料进行预处理;模型训练微调模块:使用预训练模型BERT对预处理后的文本信息进行文本表示数字化,在BERT模型后连接构建1层的全连接网络,基于训练数据集进行模型训练和微调获得分类模型;能力水平等级预测模块:在测试集上对基于预训练模型BERT的分类模型进行评分以检验效果;解决了现有技术针对电力系统调度员等级评估耗费大量人力物力且效率低下,同时当前基于分类的方法准确率不高等技术问题。