一种针对模型倾斜攻击的检测方法及系统

    公开(公告)号:CN112733140A

    公开(公告)日:2021-04-30

    申请号:CN202011605328.8

    申请日:2020-12-28

    Abstract: 本发明一种针对模型倾斜攻击的检测方法及系统,包括以下步骤:步骤S1,获取被篡改的训练数据集data11,测试数据集data22;步骤S2,对数据集样本进行分词处理,得到N维的样本数据特征向量V;步骤S3,对N维的样本数据特征向量V进行编码,生成样本指纹;步骤S4,对所得到的指纹进行相似度匹配,得到相似度高的样本集即为篡改数据。本发明所提供的一种针对存在大量相似文本的训练数据导致模型分类产生倾斜的攻击方式的检测方法,通过人为修改样本数据,保证样本数据存在大量重复,样本数据更准确,基于指纹相似度匹配可快速识别。另外,本发明所提供的检测方法还可应用在模型反馈机制武器化的检测上,通过对海量反馈信息进行相似度匹配从而找出恶意反馈内容。

    一种识别呼叫中心骚扰电话的方法及系统

    公开(公告)号:CN110913081B

    公开(公告)日:2021-04-20

    申请号:CN201911195920.2

    申请日:2019-11-28

    Abstract: 本发明公开了一种识别呼叫中心骚扰电话的方法及系统,具体为,先进行电话通话因子基准向量的建模,建模过程为:获取呼叫中心全量电话第一通话数据基础表,构建通话特征,生成第一通话特征宽表,生成通话因子挖掘表,生成电话号码的分类,其类中心确定为骚扰电话通话因子基准向量;然后进行骚扰电话识别,具体为:获取待识别电话的第二通话数据基础表;生成第二通话特征宽表,再生成待识别电话的通话因子向量,计算骚扰电话通话因子基准向量与通话因子向量之间的相似度。建模过程仅需要一次聚类和专家经验,此后不再需要人工参与,降低主观性;识别过程仅提取待识别电话的短周期通话数据,数据获取工作量小、运算量小、耗时短。

    一种基于日志分析的数据库三层关联的识别方法

    公开(公告)号:CN111752727A

    公开(公告)日:2020-10-09

    申请号:CN202010611005.3

    申请日:2020-06-30

    Abstract: 本发明提供了一种基于日志分析的数据库三层关联的识别方法,通过对request日志和sql日志进行筛选和处理,通过时间窗口特征获得主体对象的相关率,并结合参数相关值确定三层关联关系。本发明提供的基于日志分析的数据库三层关联的识别方法的优点在于:仅通过对request和sql日志进行分析,就能精准识别出数据库的三层关联,不需要对系统进行改造,成本较低,在得到表K后能够对现有日志进行三层关联识别,对新的日志进行三层关联的预测,而且本发明提供的方法是根据历史数据不断更新的,能够不断学习,随着数据样本越来越多,识别的准确性也越来越高;通过参数的相关值和主体对象的相关率综合考虑关联性排序,识别结果准确。

    一种主机操作指令异常识别的方法及系统

    公开(公告)号:CN111143840A

    公开(公告)日:2020-05-12

    申请号:CN201911406512.7

    申请日:2019-12-31

    Abstract: 本发明提供一种主机操作指令异常识别的方法及系统,包括S1.样本数据提取;S2.数据处理;得到行为序列记录和每个主机操作指令使用频次;S3:非常用指令筛选,得到目标操作指令序列;S4:紧凑预测树训练,得到目标紧凑预测树;S5:紧凑预测树预测,得到带有标签的训练数据集;S6:利用word2vec训练操作指令向量,形成预训练向量;S7:利用Bi-LSTM建立分类识别模型;S8:利用分类模型进行预测。本发明采用紧凑预测树对用户主机操作指令序列进行分析,研究指令行为序列之间的行为关系,从而判断用户主机操作指令是否异常。基于此,还充分考虑了用户操作指令之间的内在关系,研究了指令在时间维度的逻辑关系,提高主机操作指令异常的对象识别准确度。

    基于数据库的数据泄露检测模型的建模方法、装置,泄露检测方法、系统

    公开(公告)号:CN110990867A

    公开(公告)日:2020-04-10

    申请号:CN201911193700.6

    申请日:2019-11-28

    Abstract: 本发明提供一种基于数据库的数据泄露检测模型的建模方法、装置,泄露检测方法、系统,包括以下步骤:A、角色和用户组关系的建立:S100.数据采集,数据包括操作日志数据、用户角色数据、敏感数据列表;S200.解析SQL语句,提取表名;S300.数据关联及特征加工;S400.用户组的建立,定义用户组;S500.建立角色和用户组的关系;B、OneClassSvm模型训练:S600.正样本特征加工,S700.正样本中每个用户组对应一个OneClassSvm模型,并对该用户组内的第二宽表数据进行OneClassSvm模型训练,从而获得该用户组下正常数据的边界。本发明针基于数据库,对用户聚类出用户组,有别于提供的角色属性,这样可以保证用户的角色属性划分不合理的情况下,也可以科学的进行组内异常探索。

    一种用户操作次数波动异常的确定方法及装置

    公开(公告)号:CN110990242A

    公开(公告)日:2020-04-10

    申请号:CN201911200304.1

    申请日:2019-11-29

    Abstract: 本发明提供了一种用户操作次数波动异常的确定方法及装置,方法包括:1)、获取待鉴定用户的当前自然日之前设定时段内的操作日志;2)、根据用户在设定时段内的平均操作次数以及平均操作次数的标准差的商,获取当前自然日的变异系数;3)、计算当前自然日对应的当前变异系数波动值;并获取用户在设定时段内各个自然日的历史变异系数波动值;4)、根据在历史变异系数波动值范围内预设设置的外限值以及内限值,判断当前变异系数波动值是否超出了外限值与内限值之间的范围;若是,将用户在当前自然日的操作标记为操作次数波动异常。应用本发明实施例,提高了异常操作的检出率。

    识别伪造MAC地址群体的方法及装置

    公开(公告)号:CN110933079A

    公开(公告)日:2020-03-27

    申请号:CN201911200312.6

    申请日:2019-11-29

    Abstract: 本发明提供了识别伪造MAC地址群体的方法及装置,所述方法包括:1)、获取待识别的MAC地址集,其中,所述地址集中包括至少两个待识别MAC地址;2)、将所述地址集作为当前集,获取所述当前集的子集,并根据所述子集中的待识别MAC地址间的字符的组合的信息熵获取所述子集的特征值,并将最小特征值对应的MAC地址作为伪造MAC地址,其中,所述子集中所包含的待识别MAC地址的数量比所述当前集中所包含的待识别MAC地址的数量少一个,且所述子集中包括的待识别MAC地址的数量大于2。应用本发明实施例,可以解决现有技术无法识别伪造MAC地址的技术问题。

    一种基于无监督算法的养卡号码检测方法及系统

    公开(公告)号:CN110751231A

    公开(公告)日:2020-02-04

    申请号:CN201911044758.4

    申请日:2019-10-30

    Abstract: 本发明实施例提供了一种基于无监督算法的养卡号码检测方法及系统,方法包括:1)、采集运营商电渠登录日志数据;2)、从登录日志数据中获取用户的登录行为特征,并将用户登录行为特征作为第一特征集合,将对应于用户登录行为特征的高维统计特征作为第二特征集合;3)、利用孤立森林算法识别出第一特征集合对应的各个异常群体;并使用聚类算法对第二特征集合中的特征进行聚类,得到若干个聚类,并根据登录行为特征的稳定性获取异常聚类;4)、根据异常群体所对应的号码中被聚类到异常聚类中的数量与,异常群体所对应的号码的比例,确定异常群体对应的号码是否属于养卡号码。应用本发明实施例,可以提高养卡号码识别的准确率。

Patent Agency Ranking