-
公开(公告)号:CN106682208B
公开(公告)日:2020-04-03
申请号:CN201611260965.X
申请日:2016-12-30
Applicant: 桂林电子科技大学
IPC: G06F16/9536 , G06Q50/00
Abstract: 本发明公开了一种基于融合特征筛选与随机森林的微博转发行为预测方法,首先,从互联网中采集数据,并对其进行清洁整理,生成用户信息、用户博文信息存放到用户数据库,从用户数据库中提取用户基本特征、博文基本特征、博文主题特征,并基于相对熵计算用户活跃度、博文影响力;其次,通过Filter特征选择法与Wrapper特征选择法筛选出关键特征组;最后,融合异常检测与随机森林算法,依据筛选后的关键特征组进行微博转发行为预测,并利袋外数据误差估计设置随机森林中决策树和特征数。本发明有效解决了目前微博转发行为预测特征选择任意性,准确率不高的问题。
-
公开(公告)号:CN106682208A
公开(公告)日:2017-05-17
申请号:CN201611260965.X
申请日:2016-12-30
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于融合特征筛选与随机森林的微博转发行为预测方法,首先,从互联网中采集数据,并对其进行清洁整理,生成用户信息、用户博文信息存放到用户数据库,从用户数据库中提取用户基本特征、博文基本特征、博文主题特征,并基于相对熵计算用户活跃度、博文影响力;其次,通过Filter特征选择法与Wrapper特征选择法筛选出关键特征组;最后,融合异常检测与随机森林算法,依据筛选后的关键特征组进行微博转发行为预测,并利袋外数据误差估计设置随机森林中决策树和特征数。本发明有效解决了目前微博转发行为预测特征选择任意性,准确率不高的问题。
-