-
公开(公告)号:CN103927398B
公开(公告)日:2016-12-28
申请号:CN201410188004.7
申请日:2014-05-07
Applicant: 中国人民解放军信息工程大学
IPC: G06F17/30
Abstract: 本发明涉及基于最大频繁项集挖掘的微博炒作群体发现方法,有效解决微博炒作群体的发现,防止虚假恶意炒作的问题,方法是,以炒作微博的相关性为线索,基于爬虫技术或微博公共开放平台获取参与炒作微博传播的账户集合;以单个微博为事务,参与微博传播的账户为项,构建炒作微博事务数据库;对待检测微博组所对应的事务数据库中的每个事务,找出所有事务中包含的最大频繁项集,计算每个最大频繁项集间的重叠率,将规模小的项集归并到大项集中,减少交集次数,事务间取交集时,用二分查找法判断事务中是否包含某项目,提高挖掘最大频繁项集的效率,发现微博炒作群体,本发明方法简单,能准确发现恶意微博炒作群体,防止给社会造成的不良影响。
-
公开(公告)号:CN103927398A
公开(公告)日:2014-07-16
申请号:CN201410188004.7
申请日:2014-05-07
Applicant: 中国人民解放军信息工程大学
IPC: G06F17/30
CPC classification number: G06F17/30864
Abstract: 本发明涉及基于最大频繁项集挖掘的微博炒作群体发现方法,有效解决微博炒作群体的发现,防止虚假恶意炒作的问题,方法是,以炒作微博的相关性为线索,基于爬虫技术或微博公共开放平台获取参与炒作微博传播的账户集合;以单个微博为事务,参与微博传播的账户为项,构建炒作微博事务数据库;对待检测微博组所对应的事务数据库中的每个事务,找出所有事务中包含的最大频繁项集,计算每个最大频繁项集间的重叠率,将规模小的项集归并到大项集中,减少交集次数,事务间取交集时,用二分查找法判断事务中是否包含某项目,提高挖掘最大频繁项集的效率,发现微博炒作群体,本发明方法简单,能准确发现恶意微博炒作群体,防止给社会造成的不良影响。
-