基于无监督算法的用户异常检测方法及装置

    公开(公告)号:CN113837325B

    公开(公告)日:2022-03-01

    申请号:CN202111410811.5

    申请日:2021-11-25

    Abstract: 本申请公开了基于无监督算法的用户异常检测方法及装置,涉及网络安全检测技术领域,可以提升用户异常检测的准确率。其中方法包括:获取web系统的用户行为日志数据;根据所述用户行为日志数据对应的多个业务场景类别,分别计算出目标用户在多个不同时间周期内的贝叶斯平均值,所述贝叶斯平均值是根据目标用户的单维行为特征数据确定的;根据目标用户在多个业务场景类别,以及多个不同时间周期内的贝叶斯平均值,利用不同的无监督模型分别得到目标用户在每个业务场景类别中的初始评估结果;根据所述初始评估结果中的评估标签类型,通过对所述初始评估结果中的评估分值进行调整,得到目标用户的异常检测结果。

    识别伪造MAC地址群体的方法及装置

    公开(公告)号:CN110933079B

    公开(公告)日:2021-10-19

    申请号:CN201911200312.6

    申请日:2019-11-29

    Abstract: 本发明提供了识别伪造MAC地址群体的方法及装置,所述方法包括:1)、获取待识别的MAC地址集,其中,所述地址集中包括至少两个待识别MAC地址;2)、将所述地址集作为当前集,获取所述当前集的子集,并根据所述子集中的待识别MAC地址间的字符的组合的信息熵获取所述子集的特征值,并将最小特征值对应的MAC地址作为伪造MAC地址,其中,所述子集中所包含的待识别MAC地址的数量比所述当前集中所包含的待识别MAC地址的数量少一个,且所述子集中包括的待识别MAC地址的数量大于2。应用本发明实施例,可以解决现有技术无法识别伪造MAC地址的技术问题。

    一种时序行为异常波动检测方法及系统

    公开(公告)号:CN113344133A

    公开(公告)日:2021-09-03

    申请号:CN202110740773.3

    申请日:2021-06-30

    Abstract: 一种时序行为异常波动检测方法及系统,属于数据处理技术领域,解决在面对各种各样的工业级场景时,如何实现基于业务数据的时间序列行为的异常检测的问题;通过获取时间序列数组、计算变异系数、变异系数差值计算及处理、计算正常行为数值波动区间以及异常对象判断;将不同数量级别对象,统一到同一水平进行考虑,确定时序行为中某些异常程度极高的对象,有效降低安全检测场景误报;随着时间变化按既定周期提取的数据集也会随着时间进行改变,因此行为数据检测结果与近期时间周期内行为相关,不依赖于较早历史数据,剔除了历史规律的影响;将所有对象统一到同一维度进行比较,可以识别出大多数高频检测方法无法识别的低频异常操作对象。

    一种针对模型倾斜攻击的检测方法及系统

    公开(公告)号:CN112733140A

    公开(公告)日:2021-04-30

    申请号:CN202011605328.8

    申请日:2020-12-28

    Abstract: 本发明一种针对模型倾斜攻击的检测方法及系统,包括以下步骤:步骤S1,获取被篡改的训练数据集data11,测试数据集data22;步骤S2,对数据集样本进行分词处理,得到N维的样本数据特征向量V;步骤S3,对N维的样本数据特征向量V进行编码,生成样本指纹;步骤S4,对所得到的指纹进行相似度匹配,得到相似度高的样本集即为篡改数据。本发明所提供的一种针对存在大量相似文本的训练数据导致模型分类产生倾斜的攻击方式的检测方法,通过人为修改样本数据,保证样本数据存在大量重复,样本数据更准确,基于指纹相似度匹配可快速识别。另外,本发明所提供的检测方法还可应用在模型反馈机制武器化的检测上,通过对海量反馈信息进行相似度匹配从而找出恶意反馈内容。

    一种识别呼叫中心骚扰电话的方法及系统

    公开(公告)号:CN110913081B

    公开(公告)日:2021-04-20

    申请号:CN201911195920.2

    申请日:2019-11-28

    Abstract: 本发明公开了一种识别呼叫中心骚扰电话的方法及系统,具体为,先进行电话通话因子基准向量的建模,建模过程为:获取呼叫中心全量电话第一通话数据基础表,构建通话特征,生成第一通话特征宽表,生成通话因子挖掘表,生成电话号码的分类,其类中心确定为骚扰电话通话因子基准向量;然后进行骚扰电话识别,具体为:获取待识别电话的第二通话数据基础表;生成第二通话特征宽表,再生成待识别电话的通话因子向量,计算骚扰电话通话因子基准向量与通话因子向量之间的相似度。建模过程仅需要一次聚类和专家经验,此后不再需要人工参与,降低主观性;识别过程仅提取待识别电话的短周期通话数据,数据获取工作量小、运算量小、耗时短。

    一种基于日志分析的数据库三层关联的识别方法

    公开(公告)号:CN111752727A

    公开(公告)日:2020-10-09

    申请号:CN202010611005.3

    申请日:2020-06-30

    Abstract: 本发明提供了一种基于日志分析的数据库三层关联的识别方法,通过对request日志和sql日志进行筛选和处理,通过时间窗口特征获得主体对象的相关率,并结合参数相关值确定三层关联关系。本发明提供的基于日志分析的数据库三层关联的识别方法的优点在于:仅通过对request和sql日志进行分析,就能精准识别出数据库的三层关联,不需要对系统进行改造,成本较低,在得到表K后能够对现有日志进行三层关联识别,对新的日志进行三层关联的预测,而且本发明提供的方法是根据历史数据不断更新的,能够不断学习,随着数据样本越来越多,识别的准确性也越来越高;通过参数的相关值和主体对象的相关率综合考虑关联性排序,识别结果准确。

Patent Agency Ranking