发明公开
- 专利标题: 一种基于文本挖掘的企业安全生产风险等级划分方法
-
申请号: CN202310581713.0申请日: 2023-05-23
-
公开(公告)号: CN116629609A公开(公告)日: 2023-08-22
- 发明人: 蒋永清 , 曹震
- 申请人: 哈尔滨理工大学
- 申请人地址: 黑龙江省哈尔滨市南岗区学府路52号哈尔滨理工大学
- 专利权人: 哈尔滨理工大学
- 当前专利权人: 哈尔滨理工大学
- 当前专利权人地址: 黑龙江省哈尔滨市南岗区学府路52号哈尔滨理工大学
- 主分类号: G06Q10/0635
- IPC分类号: G06Q10/0635 ; G06F16/35 ; G06F40/216 ; G06F40/284 ; G06F40/295 ; G06F18/23213 ; G06F18/22
摘要:
一种基于文本挖掘的企业安全生产风险等级划分方法,属于安全预警方法领域。如何利用文本数据挖掘技术以发掘现有的企业安全管理产生大量文本数据的内在价值,对企业安全风险等级进行划分是目前本技术领域的空白技术。一种基于文本挖掘的企业安全生产风险等级划分方法,基于NLP方法,运用Excel处理工具结合Python编程语言,将隐患文本规范化;之后,对隐患的主题词进行提取、词频统计和词云生成的操作;利用Gensim库训练安全检查文本的词向量;采用TF‑IDF算法提取各隐患描述文本的关键词,利用训练好的词向量模型分别计算其相似词;通过均值聚类的操作,得到不同隐患主题。对企业的安全风险进行等级划分。