基于HC-TC-LDA的重大事件趋势预测方法
摘要:
本发明公开基于HC‑TC‑LDA的重大事件趋势预测方法。首先,采用网络爬虫爬取专题新闻数据;然后,利用主题模型抽取特征,并针对LDA主题模型存在大量噪声词,且必须凭借经验手动设置主题数目的问题,设计了融合层次聚类、单词贡献度、LDA的主题模型HC‑TC‑LDA;最后,采用机器学习分类模型构建重大事件趋势预测模型。本发明方法的预测性能优于依赖专家知识进行特征指标构建的传统方法,能有效实现重大事件趋势的高精度预测,并且在方法普适性与时效性上该方法均具有一定优势,无需更多的领域专家知识,为战略决策制定提供一定的辅助支持,具有广阔的应用前景。
公开/授权文献
0/0