-
公开(公告)号:CN112199926A
公开(公告)日:2021-01-08
申请号:CN202011111355.X
申请日:2020-10-16
Applicant: 中国地质大学(武汉)
IPC: G06F40/166 , G06F40/284 , G06F40/30
Abstract: 本发明提供了一种基于文本挖掘和自然语言处理的地质报告文本可视化方法;包括首先,利用自然语言处理技术对地质报告进行数据预处理;其次,基于构建的停用词词库对文本中的停用词进行剔除;然后,统计相邻两个词之间共同出现的次数,并生成共现矩阵;最后,进行了词频统计、改进的TF‑IDF关键词提取等,并分别进行了词频统计可视化、关键词词云可视化、中心性分析可视化、多尺度关键词分析可视化等。本发明提出的地质报告文本可视化流程能充分发现和挖掘地质文本隐含的信息,能迅速从可视化结果中获取关键信息,使繁杂的文本信息能以非常直观的形式进行展示。本发明所提出的可视化流程对工程报告类文本具有较高的适用性和参考价值。
-
公开(公告)号:CN112199926B
公开(公告)日:2024-05-10
申请号:CN202011111355.X
申请日:2020-10-16
Applicant: 中国地质大学(武汉)
IPC: G06F40/166 , G06F40/284 , G06F40/30
Abstract: 本发明提供了一种基于文本挖掘和自然语言处理的地质报告文本可视化方法;包括首先,利用自然语言处理技术对地质报告进行数据预处理;其次,基于构建的停用词词库对文本中的停用词进行剔除;然后,统计相邻两个词之间共同出现的次数,并生成共现矩阵;最后,进行了词频统计、改进的TF‑IDF关键词提取等,并分别进行了词频统计可视化、关键词词云可视化、中心性分析可视化、多尺度关键词分析可视化等。本发明提出的地质报告文本可视化流程能充分发现和挖掘地质文本隐含的信息,能迅速从可视化结果中获取关键信息,使繁杂的文本信息能以非常直观的形式进行展示。本发明所提出的可视化流程对工程报告类文本具有较高的适用性和参考价值。
-