-
公开(公告)号:CN112149037B
公开(公告)日:2024-03-19
申请号:CN202011039074.8
申请日:2020-09-28
申请人: 微梦创科网络科技(中国)有限公司
发明人: 王嘉伟
IPC分类号: G06F16/958
摘要: 本发明实施例提供一种基于逻辑回归的实时识别异常关注的方法及系统,包括:获取用户行为日志,将预设时间段内每个用户的所有行为特征形成各自相应的行为特征列表;根据每个用户的行为特征列表,周期性统计在前一预设时间段内的各用户相应的行为特征表征值并保存在数据库内;收到某一用户向其他用户发起的关注请求时,自数据库中获取该用户的最新行为特征表征值、该用户所要关注的其他用户的最新行为特征表征值;并利用预先训练的用户特征逻辑回归模型进行训练,返回逻辑回归训练结果;将逻辑回归训练结果与预设概率阈值进行比较,判断该用户向其他用户发起的关注是否为异常关注。有效的实时的判断当前关注行为是否为异常,降低对正常用户的干扰。
-
公开(公告)号:CN111506828B
公开(公告)日:2023-04-07
申请号:CN202010202276.3
申请日:2020-03-20
申请人: 微梦创科网络科技(中国)有限公司
发明人: 王嘉伟
IPC分类号: G06F16/9536 , G06F18/23213 , G06Q50/00
摘要: 本发明实施例提供一种异常关注行为批量实时识别方法及装置,其中,所述方法包括:获取设定时间段内的关注行为日志,获取所述关注行为日志中的每一个关注行为对应的关注源用户身份证明UID和被关注用户身份证明UID;将每一个关注行为在矩阵中对应该关注行为的关注源UID和被关注UID进行标记;根据所述标记后的矩阵,对关注行为进行聚类;若聚类后的某一聚族的平均关注数量大于预设的平均阈值且该聚族的总关注数量大于预设的总阈值,则判定该聚族的所有关注行为为异常关注行为。根据本发明的技术方案,不仅能识别出发起大量关注的不法分子帐号,还能尽量减小误伤,增加查出率。
-
公开(公告)号:CN111988278B
公开(公告)日:2022-07-29
申请号:CN202010715685.3
申请日:2020-07-23
申请人: 微梦创科网络科技(中国)有限公司
发明人: 王嘉伟
IPC分类号: H04L51/222 , H04L41/069 , G06Q50/00
摘要: 本发明实施例提供一种基于用户地理位置日志的异常用户确定方法及装置,包括:获取设定时间段内所有账号的地理位置日志,生成包括多组数据的数据组S;自数据组S中提取出同一账号登录时所生成的各组数据并基于该账号登录时所处地理位置信息进行计算;根据各账号登录时所处地理位置信息的计算结果筛选出可疑账号;针对每个可疑账号,依据该可疑账号登录时所处地理位置信息的变化得到可疑账号所对应的用户在设定时间段内的移动速度,根据该可疑账号所对应的用户在设定时间段内的移动速度判断该可疑账号所对应的用户是否为异常用户。基于用户地理位置日志进行确定异常用户,可以对使用多点代理或者逃避ip封锁的不法分子账号进行不间断的找出。
-
公开(公告)号:CN107729375B
公开(公告)日:2021-11-23
申请号:CN201710821367.3
申请日:2017-09-13
申请人: 微梦创科网络科技(中国)有限公司
发明人: 王嘉伟
IPC分类号: G06F16/172 , G06F16/16
摘要: 本发明实施例提供了一种日志数据排序的方法及装置,该方法包括:针对排序周期内每一个最小时间单元,按照时间顺序依次创建各个最小时间单元分别对应的一个中间存储文件,得到中间存储文件集合;获取日志文件,顺序读取所述日志文件中的每一条日志数据,针对每一条日志数据,执行如下操作:解析读取到的当前日志数据的记录时间;确定中间存储文件集合中与解析出的记录时间所属最小时间单元相对应的中间存储文件;并将读取到的当前日志数据存储至确定出的中间存储文件中;按照时间顺序依次读取各个中间存储文件,并将读取到的各个中间存储文件中的每一条日志数据依次存储至日志存储文件中。通过本发明实现了快速简单地对巨大数量的数据进行排序。
-
公开(公告)号:CN112861128A
公开(公告)日:2021-05-28
申请号:CN202110083543.4
申请日:2021-01-21
申请人: 微梦创科网络科技(中国)有限公司
发明人: 王嘉伟
摘要: 本发明实施例提供一种批量识别机器账号的方法及系统,计算引擎Spark周期性自数据库中获取前一周期内登录账号的用户行为日志,提取出前一周期内行为数量超过预设数量阈值的所有账号;获取每个账号前一周期所有关键行为的发生时间并形成各账号的弹性数据集;按照预设的长度时间段依次统计各长度时间段内发生的关键行为数量;采用线性回归方程对任一账号各长度时间段内的关键行为数量随时间的变化关系进行拟合,得到该账号线性回归拟合曲线;并根据线性回归拟合曲线计算各账号相应的关键行为数据的拟合优度;根据每个账号关键行为数据的拟合优度批量判断各账号是否为机器账号。基于Spark查找账号的关键行为,降低对非机器账号误伤率。
-
公开(公告)号:CN112149036A
公开(公告)日:2020-12-29
申请号:CN202011038236.6
申请日:2020-09-28
申请人: 微梦创科网络科技(中国)有限公司
发明人: 王嘉伟
IPC分类号: G06F16/958
摘要: 本发明实施例提供一种批量非正常互动行为的识别方法及系统,包括:获取前一监控周期内为某一待识别的网络活动发起的互动行为数量,当为该网络活动发起的互动行为数量大于预设数量阈值时,获取所有互动行为对应的发起时间点;统计自该网络活动发布时起每个固定的间隔时间段内为该网络活动发起的互动行为数量;对每一个间隔时间段及其对应的互动行为数量进行泊松分布的概率函数的拟合,得到为该网络活动发起的互动行为所对应的泊松分布的拟合系数和拟合优度;根据泊松分布的拟合系数和拟合优度判断为该网络活动发起的互动行为是否为批量非正常互动行为。通过基于柏松分布的概率函数识别某待识别的网络活动有无发生批量非正常互动行为现象。
-
公开(公告)号:CN112115324A
公开(公告)日:2020-12-22
申请号:CN202010796580.5
申请日:2020-08-10
申请人: 微梦创科网络科技(中国)有限公司
发明人: 王嘉伟
IPC分类号: G06F16/9038 , G06F17/18 , G06Q50/00 , H04L29/12
摘要: 本发明实施例提供一种基于幂律分布确认刷赞用户的方法及装置,实时获取当前时间之前的第一设定周期内为某网络活动发起点赞的IP以及各IP的点赞数量;并与当前的点赞阈值进行比对;当某个IP在第一设定周期内为该网络活动发起的点赞数量不小于当前的点赞阈值时,判定该IP为刷赞IP;采用幂律分布对为该网络活动发起点赞的IP数量以及各IP的点赞数量进行拟合,得到幂律分布拟合曲线,根据幂律分布拟合曲线得到该网络活动点赞数据的拟合优度;根据得到的该网络活动点赞数据的拟合优度修正当前的点赞阈值。通过对一定时间内点赞数量过高的网络活动进行数据挖掘,使用基于幂律分布对点赞数据进行分析,有效的降低对正常用户的误伤。
-
公开(公告)号:CN112000709A
公开(公告)日:2020-11-27
申请号:CN202010690841.5
申请日:2020-07-17
申请人: 微梦创科网络科技(中国)有限公司
发明人: 王嘉伟
IPC分类号: G06F16/2458 , G06F16/9536 , G06Q50/00
摘要: 本发明实施例提供一种社交媒体信息的总曝光量批量挖掘方法及装置,按照预设周期遍历待挖掘的N条社交媒体信息,生成N条行数据L;根据预先构造的基于键值对数据结构的计数器组C,遍历一次所有的N条行数据L,获得N条行数据L对应的计数器组C’;根据每条社交媒体信息自身的曝光次数pv和本条社交媒体信息的所述转发列表rlist,递归地确定每个计数器对应的每条社交媒体信息的总曝光量。使用这种社交媒体信息的总曝光量批量挖掘流程之后,现在这个总曝光是可以快速计算,这个算法只对数据进行了一次遍历就能找出这段时间内所有信息的总曝光量,并且是足够迅速和准确的。
-
公开(公告)号:CN111506829A
公开(公告)日:2020-08-07
申请号:CN202010203356.0
申请日:2020-03-20
申请人: 微梦创科网络科技(中国)有限公司
发明人: 王嘉伟
IPC分类号: G06F16/9536 , G06K9/62 , G06Q50/00
摘要: 本发明实施例提供一种异常关注行为批量实时识别方法及装置,其中,所述方法包括:获取设定时间段内的关注行为日志,获取所述关注行为日志中的每一个关注行为对应的关注源用户身份证明UID和被关注用户身份证明UID;将每一个关注行为在稀疏矩阵中对应该关注行为的关注源UID和被关注UID进行标记;将所述标记后的稀疏矩阵进行奇异值分解后,对关注行为进行聚类;若聚类后的某一聚族的平均关注数量大于预设的平均阈值且该聚族的总关注数量大于预设的总阈值,则判定该聚族的所有关注行为为异常关注行为。根据本发明的技术方案,利用稀疏矩阵和奇异值分解,不仅能识别出发起大量关注的不法分子帐号,还能尽量减小误伤,增加查出率。
-
公开(公告)号:CN111178544A
公开(公告)日:2020-05-19
申请号:CN201911407853.6
申请日:2019-12-31
申请人: 微梦创科网络科技(中国)有限公司
发明人: 王嘉伟
IPC分类号: G06N20/00
摘要: 本发明实施例提供一种过拟合检测方法及装置,所述方法包括:获取机器学习模型的数据集;将所述数据集中的数据点以线性回归的方式进行拟合,获得拟合直线;确定使得所述数据集中的所有数据点与所述拟合直线之间残差平方和为最小时的拟合系数及拟合常数;改变拟合系数,获取拟合系数改变时残差平方和对应的变化幅度;根据所述变化幅度确定所述数据集的过拟合系数;若所述过拟合系数大于拟合系数阈值,则判定所述数据集过拟合。根据本发明的技术方案,提供一种训练集-测试集过拟合检测方法的一种补充或者完备。
-
-
-
-
-
-
-
-
-