-
公开(公告)号:CN106294590B
公开(公告)日:2019-05-31
申请号:CN201610614458.5
申请日:2016-07-29
Applicant: 重庆邮电大学
IPC: G06F16/9536 , G06K9/62 , G06Q50/00
Abstract: 本发明公开了一种基于半监督学习的社交网络垃圾用户过滤方法,将协同训练算法应用于社交网络垃圾用户检测。现有对社交网络中的海量信息进行的分类大多利用监督学习算法,该算法都是基于已标注数据建立的分类模型,但因社交信息规模庞大,标注数据所需人工成本巨大,且解决社交网络用户数据标注的方法不多。提出一种方法,借鉴协同训练算法,将多视图、多分类器运用到大量无标注或有少量标注的社交网络数据中,使不同视图上的分类器相互学习,实现数据标注的目的。
-
公开(公告)号:CN106296422A
公开(公告)日:2017-01-04
申请号:CN201610615016.2
申请日:2016-07-29
Applicant: 重庆邮电大学
CPC classification number: G06Q50/01 , G06F16/951 , G06K9/6269
Abstract: 本发明公开了一种融合多算法的社交网络垃圾用户检测方法,利用网络爬虫的方式从社交网络中爬取用户数据,通过分析用户的行为提取相应特征构成特征向量;接着使用K-均值(K-Means)和DBSCAN结合的聚类算法对社交网络中的用户进行聚类;从上一步的聚类结果中挑选簇边界附近的数据和聚类中心附近的数据训练支持向量机(SVM)分类器,得到分类器模型;最后采用训练得到的SVM分类器模型对社交网络中的垃圾用户进行检测。本发明降低了人工标注数据的成本、提高了检测的准确率,并且易于实现。
-
公开(公告)号:CN106294590A
公开(公告)日:2017-01-04
申请号:CN201610614458.5
申请日:2016-07-29
Applicant: 重庆邮电大学
CPC classification number: G06F16/951 , G06K9/6259 , G06K9/6267 , G06Q50/01
Abstract: 本发明公开了一种基于半监督学习的社交网络垃圾用户过滤方法,将协同训练算法应用于社交网络垃圾用户检测。现有对社交网络中的海量信息进行的分类大多利用监督学习算法,该算法都是基于已标注数据建立的分类模型,但因社交信息规模庞大,标注数据所需人工成本巨大,且解决社交网络用户数据标注的方法不多。提出一种方法,借鉴协同训练算法,将多视图、多分类器运用到大量无标注或有少量标注的社交网络数据中,使不同视图上的分类器相互学习,实现数据标注的目的。
-
-