一种基于模糊多类SVM的微博垃圾用户检测方法

    公开(公告)号:CN106557983B

    公开(公告)日:2020-11-17

    申请号:CN201611016672.7

    申请日:2016-11-18

    Abstract: 本发明公开了一种基于模糊多类SVM的微博垃圾用户检测方法,将一对多SVM多类分类器与模糊数学理论相结合用于微博垃圾用户检测。现有的微博垃圾用户研究,都是对全局的垃圾用户特征进行分析,分析力度不够,缺乏针对某类垃圾用户的特征分析,这样会使垃圾用户逃避检测系统的检测。本发明通过对微博垃圾用户的特征进行分析,将垃圾用户分为三类,构造一对多SVM多类分类器,并针对多类分类器产生的混分样本使用模糊聚类方法进行模糊处理,得到组合分类器,提高了检测精度。

    一种基于变异思想改进粒子群算法的主题爬虫系统及方法

    公开(公告)号:CN109766486B

    公开(公告)日:2023-03-31

    申请号:CN201811488041.4

    申请日:2018-12-06

    Abstract: 本发明公开了一种基于变异思想改进粒子群算法的主题爬虫系统及方法,涉及种子集选取、页面初始权值计算与算法改进三个部分。种子集选取模块主要是基于主题相关页面的点击率获取3种不同类型的种子页面,其中包括人工去重操作;页面初始权值计算模块包括网页文本预处理、关键词选择及权值计算三个步骤;算法改进模块是基于变异思想改进粒子群算法。本爬虫系统对主题爬虫寻优精度不高的问题提供了思路。

    一种基于变异思想改进粒子群算法的主题爬虫系统及方法

    公开(公告)号:CN109766486A

    公开(公告)日:2019-05-17

    申请号:CN201811488041.4

    申请日:2018-12-06

    Abstract: 本发明公开了一种基于变异思想改进粒子群算法的主题爬虫系统及方法,涉及种子集选取、页面初始权值计算与算法改进三个部分。种子集选取模块主要是基于主题相关页面的点击率获取3种不同类型的种子页面,其中包括人工去重操作;页面初始权值计算模块包括网页文本预处理、关键词选择及权值计算三个步骤;算法改进模块是基于变异思想改进粒子群算法。本爬虫系统对主题爬虫寻优精度不高的问题提供了思路。

    一种基于云平台的心率检测与分析系统

    公开(公告)号:CN107411733A

    公开(公告)日:2017-12-01

    申请号:CN201710239199.7

    申请日:2017-04-13

    Abstract: 本发明提供了一种基于云平台的心率检测与分析系统,主要步骤包括:获取用户在Android智能手机终端上输入的个人信息并将其传送至云平台;将心电数据采集设备与Android手机相连,然后通过手机蓝牙接收其采集到的心电数据,并对心电数据进行预处理,检测出QRS波群,计算出心率值;将预处理后的心电数据和心率值采用MQTT(Message Queuing Telemetry Transport,消息队列遥测传输)协议传送至云服务平台进行存储与分析,并将分析结果推送至手机客户端,最终实现手机客户端和WEB服务器端同步显示心电波形图和心率检测与分析结果。

    一种基于派系过滤的意见垃圾用户群检测方法

    公开(公告)号:CN109408634A

    公开(公告)日:2019-03-01

    申请号:CN201811083188.5

    申请日:2018-09-17

    Abstract: 本发明请求保护一种基于派系过滤的意见垃圾用户群检测方法,涉及生成候选意见垃圾用户群和排名候选意见垃圾用户群两个部分。因为意见垃圾检测领域普遍缺乏标记数据,且人工标记在大规模数据集上不可行,所以本方法采用一种完全无监督的方法来检测意见垃圾用户群。首先将评论数据建模为评论者-产品二分图,在此基础上产生评论者投影,基于派系过滤方法找到评论者投影中的候选意见垃圾用户群;接着,采用基于个人和基于群组的垃圾指标得到每个候选意见垃圾用户群的垃圾分数,利用垃圾分数对候选意见垃圾用户群进行排名,排名越靠前的群组可疑性越大。

    一种基于和声搜索的混合特征选择方法

    公开(公告)号:CN106897413A

    公开(公告)日:2017-06-27

    申请号:CN201710090165.6

    申请日:2017-02-20

    CPC classification number: G06F17/30743

    Abstract: 本发明公开了一种基于和声搜索的混合特征选择方法,将过滤器与和声搜索的优点结合起来,形成一个混合系统。该系统能从大量用户原始特征集中选择最优特征子集,并将该特征子集用于社交网络中垃圾用户的分类和检测。目前,分类器的性能好坏取决于特征子集的选取,而特征选择问题可以被看作是优化问题,其目标是选择最佳的或接近最佳的特征子集。提出一种方法,利用滤波方法与和声算法的计算简单、迅速的优点实现最佳特征子集选取的目的。克服了过滤方法忽略特征之间依赖关系和包装器计算成本较高的缺点。

Patent Agency Ranking