一种异常行为检测方法及装置

    公开(公告)号:CN111614690B

    公开(公告)日:2022-10-11

    申请号:CN202010465586.4

    申请日:2020-05-28

    Abstract: 本发明提供了一种异常行为检测方法及装置,所述方法包括:1)、获取对应于待检测用户的原始数据,其中,所述原始数据包括:用户的设备属性信息、风控数据、业务数据;2)、基于所述原始数据对应的平稳序列,利用ARIMA模型识别出待检测用户中的第一异常用户;3)、基于所述原始数据,利用聚类算法,获取待检测用户中的第二异常用户;4)、利用密度和网格的聚类算法对第一异常用户以及第二异常用户进行风险评级,得到异常风险高的待检测用户。应用本发明实施例,提高了安全性能。

    用户群体的分类方法、装置、存储介质及计算机设备

    公开(公告)号:CN113836370B

    公开(公告)日:2022-03-01

    申请号:CN202111412279.0

    申请日:2021-11-25

    Abstract: 本发明公开了一种用户群体的分类方法、装置、存储介质及计算机设备。其中方法包括:获取用户群体的行为数据,并对用户群体的行为数据进行预处理,得到以每个用户的用户名为主体对象的行为序列数据集;利用关联分析算法,对行为序列数据集中的频繁行为指令组合进行提取和频次统计,得到频繁指令组合特征表;通过序列对比算法,计算行为序列数据集中的各个行为序列之间的序列匹配分值和序列间相似度分值,得到序列相似性特征表;对行为序列数据集中的行为指令进行频次统计,得到行为指令频次特征表;采用半监督分类算法,对频繁指令组合特征表、序列相似性特征表和行为指令频次特征表进行分类分析,得到具有不同类别的用户群体,以提高分类效率。

    投毒数据识别方法、装置、系统及计算机可读存储介质

    公开(公告)号:CN114004297A

    公开(公告)日:2022-02-01

    申请号:CN202111286282.2

    申请日:2021-11-02

    Abstract: 本发明实施例公开了一种投毒数据识别方法、装置、系统及计算机可读存储介质,其中所述方法包括:获取参照干净数据集Dclean以及初始测试数据集Dtarget;将所述初始测试数据集Dtarget中,原标注标签与数据内容不一致的数据记为标签修改的投毒数据,将所述标签修改的投毒数据从所述初始测试数据集Dtarget中剔除,得到标准测试数据集D′target;根据所述参照干净数据集Dclean,将所述标准测试数据集D′target中,数据内容添加了扰动或后门触发器的数据标记为标签不变的投毒数据;删除所述标准测试数据集D′target中标签不变的投毒数据,得到纯净数据集。本发明对初始测试数据集中的标签修改投毒数据和标签不变投毒数据进行分别识别、删除,提高了投毒数据的识别准确率。

    一种非法集资企业识别方法、装置及计算机存储介质

    公开(公告)号:CN113987165A

    公开(公告)日:2022-01-28

    申请号:CN202111180119.8

    申请日:2021-10-11

    Abstract: 本发明公开一种非法集资企业识别方法、装置及计算机存储介质。其中,该方法包括:获取全部企业所有共同信息和所有非共同信息;全部企业包括:原有企业和新增企业;将每个共同信息和每个非共同信息进行特征工程化,得到全部企业的所有特征值;对新增企业的共同信息和非共同信息的类别标记为训练类别;根据新增企业的特征值对归属于同一训练类别的原有企业的特征值进行模型训练,得到预测模型;通过预测模型,对新增企业的共同信息和非共同信息对应的特征值进行预测,得到新增企业是否为非法集资企业的预测结果。该方法因使用归属于同一训练类别的原有企业的特征值进行模型训练,从而能够给出准确性很高的非法集资企业的识别结果。

    一种敏感数据接口爬虫识别方法及装置

    公开(公告)号:CN113821754A

    公开(公告)日:2021-12-21

    申请号:CN202111100833.1

    申请日:2021-09-18

    Abstract: 本发明公开了一种敏感数据接口爬虫识别方法及装置,所述方法包括:获取网站的web访问日志;根据web访问日志对爬虫进行识别;判断爬虫类型;按照不同的爬虫类型使用爬虫的参数向网站发起请求,获取请求响应的内容并按照请求url归集请求响应的内容,将网站返回的内容的文本部分按照归集域名分组进行存储;提取存储的文本的特征数据,每个域名下的文本对应提取出重要链接地址、文本关键词结果;识别文本关键词结果中是否敏感信息,输出是否涉敏,涉敏数据类型;本发明的优点在于:对爬虫动机进行有效识别,识别出涉及敏感信息的爬虫行为,保障网络信息安全。

    数据集质量评估方法、装置、计算机设备及存储介质

    公开(公告)号:CN113448955B

    公开(公告)日:2021-12-07

    申请号:CN202110999774.X

    申请日:2021-08-30

    Abstract: 本发明公开了一种数据集质量评估方法、装置、计算机设备及存储介质,涉及信息技术领域,主要在于能够提高数据集质量的评估精度和评估效率。其中方法包括:获取数据集中的待评估数据;分别统计所述待评估数据在多个评估维度下的属性特征;基于所述多个评估维度下的属性特征,对所述待评估数据进行质量评估,得到所述待评估数据分别在所述多个评估维度下的质量评估结果。本发明适用于数据集质量的评估。

    溯源分析方法、电子设备及计算机存储介质

    公开(公告)号:CN109347992B

    公开(公告)日:2021-08-10

    申请号:CN201810949466.4

    申请日:2018-08-20

    Abstract: 本申请实施例中提供了一种溯源分析方法、电子设备及计算机存储介质。采用本申请中的方案,确定第一参数n、第二参数k和初始节点S0;从1至n的整数中依次取值,每当取一值后,基于S0,确定路径长度为取到的值的节点,在节点中确定展开节点,计算展开节点至S0之间的距离;基于k和距离进行溯源。本申请从1至n的整数中依次取值,每当取一值后,基于S0,确定路径长度为取到的值的节点,在节点中确定展开节点,计算展开节点至S0之间的距离;基于k和距离进行溯源,可以在某个节点关联的信息过多时,从中分辨出有价值的信息。

    一种基于spark图算法的互连关系分类方法及系统

    公开(公告)号:CN112714080A

    公开(公告)日:2021-04-27

    申请号:CN202011543625.4

    申请日:2020-12-23

    Abstract: 本发明一种基于spark图算法的互连关系分类方法,包括生成节点数据表V和关系数据表E;基于节点数据表V和关系数据表E,应用Spark图算法,生成图关系G;使用Lovain算法进行通信群体发现;结合业务进行群体标签设置,进行群体分类;并筛选游离关系记为游离关系表P。还提供基于该方法的系统。本发明采用将电力终端通信网络映射为以IP为结点,通信关系为边,IP发送指令相似度为边权值的有向加权网络,采用了经典社区分类算法Louvain进行社群挖掘,同时设计了基于设备通信指令相似度的关系权重,作为明显特征,有效提高了算法分类效果,最终可以准确高效的完成通信设备之间互连关系分类,获得分类明显的通信群体。

    基于孤立森林算法对异常点进行特征分析的方法及系统

    公开(公告)号:CN112418355A

    公开(公告)日:2021-02-26

    申请号:CN202011480846.1

    申请日:2020-12-16

    Abstract: 本发明提供一种基于孤立森林算法对异常点进行异常特征分析的方法及系统,数据安全技术领域。包括以下步骤:对每个数据点,获取其在每棵树上的分支路径所使用的切分特征序列;依据在特征序列上出现的位置和次数,计算每个特征的重要性,对特征进行排序;依据孤立森林输出的异常概率选取异常点,再依据排序后特征序列,输出异常点的TOP特征。本发明基于孤立森林算法思想,对异常点进行深入解释,通过计算特征序列上的每个特征的重要性,然后根据重要性对特征进行排序,最后输出异常点的TOP特征,即可确定异常点的异常维度,有助于在实际业务场景中对异常点进行业务解释和归类,帮助数据分析人员和业务人员对业务异常进行总结和归纳。

Patent Agency Ranking