发明公开
- 专利标题: 一种电力生产安全隐患文本聚类方法及系统
-
申请号: CN202310795596.8申请日: 2023-06-30
-
公开(公告)号: CN117076665A公开(公告)日: 2023-11-17
- 发明人: 张博 , 梁浩 , 白洋 , 邱实 , 许朕玮 , 姜庆轩 , 李嘉诚
- 申请人: 国网辽宁省电力有限公司锦州供电公司 , 东北电力大学 , 国家电网有限公司
- 申请人地址: 辽宁省锦州市古塔区解放路三段9号; ;
- 专利权人: 国网辽宁省电力有限公司锦州供电公司,东北电力大学,国家电网有限公司
- 当前专利权人: 国网辽宁省电力有限公司锦州供电公司,东北电力大学,国家电网有限公司
- 当前专利权人地址: 辽宁省锦州市古塔区解放路三段9号; ;
- 代理机构: 锦州辽西专利事务所
- 代理商 李辉
- 主分类号: G06F16/35
- IPC分类号: G06F16/35 ; G06F18/213 ; G06F18/23213 ; G06F18/2113 ; G06N3/006 ; G06N3/0442 ; G06F40/284
摘要:
一种电力生产安全隐患文本聚类方法及系统,包括:基于TF‑IDF算法对电力生产安全隐患文本进行jieba文本预处理,生成文本集;对生成的文本集进行基于LSTM的Word2vec文本特征提取;对经过Word2vec文本特征提取的文本集进行基于粒子群优化的K‑means聚类。本发明克服了Word2vec文本特征提取方法中存在的词向量固化和复杂度高的缺点,解决了聚类速度慢和容易陷入局部最优解问题,从而提高电力生产安全隐患文本聚类的效果和准确率;并且能够更好地捕捉电力生产安全隐患文本中单词的含义和上下文信息,满足了下一步聚类方法所需要的文本数据。