一种基于文本挖掘的企业安全生产风险等级划分方法
摘要:
一种基于文本挖掘的企业安全生产风险等级划分方法,属于安全预警方法领域。如何利用文本数据挖掘技术以发掘现有的企业安全管理产生大量文本数据的内在价值,对企业安全风险等级进行划分是目前本技术领域的空白技术。一种基于文本挖掘的企业安全生产风险等级划分方法,基于NLP方法,运用Excel处理工具结合Python编程语言,将隐患文本规范化;之后,对隐患的主题词进行提取、词频统计和词云生成的操作;利用Gensim库训练安全检查文本的词向量;采用TF‑IDF算法提取各隐患描述文本的关键词,利用训练好的词向量模型分别计算其相似词;通过均值聚类的操作,得到不同隐患主题。对企业的安全风险进行等级划分。
0/0