-
公开(公告)号:CN112714080A
公开(公告)日:2021-04-27
申请号:CN202011543625.4
申请日:2020-12-23
Applicant: 上海观安信息技术股份有限公司
IPC: H04L12/851 , H04L12/24 , G06K9/62
Abstract: 本发明一种基于spark图算法的互连关系分类方法,包括生成节点数据表V和关系数据表E;基于节点数据表V和关系数据表E,应用Spark图算法,生成图关系G;使用Lovain算法进行通信群体发现;结合业务进行群体标签设置,进行群体分类;并筛选游离关系记为游离关系表P。还提供基于该方法的系统。本发明采用将电力终端通信网络映射为以IP为结点,通信关系为边,IP发送指令相似度为边权值的有向加权网络,采用了经典社区分类算法Louvain进行社群挖掘,同时设计了基于设备通信指令相似度的关系权重,作为明显特征,有效提高了算法分类效果,最终可以准确高效的完成通信设备之间互连关系分类,获得分类明显的通信群体。
-
公开(公告)号:CN112418355A
公开(公告)日:2021-02-26
申请号:CN202011480846.1
申请日:2020-12-16
Applicant: 上海观安信息技术股份有限公司
Abstract: 本发明提供一种基于孤立森林算法对异常点进行异常特征分析的方法及系统,数据安全技术领域。包括以下步骤:对每个数据点,获取其在每棵树上的分支路径所使用的切分特征序列;依据在特征序列上出现的位置和次数,计算每个特征的重要性,对特征进行排序;依据孤立森林输出的异常概率选取异常点,再依据排序后特征序列,输出异常点的TOP特征。本发明基于孤立森林算法思想,对异常点进行深入解释,通过计算特征序列上的每个特征的重要性,然后根据重要性对特征进行排序,最后输出异常点的TOP特征,即可确定异常点的异常维度,有助于在实际业务场景中对异常点进行业务解释和归类,帮助数据分析人员和业务人员对业务异常进行总结和归纳。
-
公开(公告)号:CN111814436A
公开(公告)日:2020-10-23
申请号:CN202010731634.X
申请日:2020-07-27
Applicant: 上海观安信息技术股份有限公司
IPC: G06F40/151 , G06F40/216 , H04L29/06 , H04L29/08
Abstract: 本发明提供一种基于互信息和熵的用户行为序列检测方法,基于web系统操作日志数据,根据用户行为序列,通过互信息及熵获得专业行为序列库,再通过行为序列的波动检测疑似异常用户的过程,一方面,该方法是一种无监督的方法,适应性较强,不需要业务经验,能够很快获得网站的专有行为序列库;另一方面,通过比较两个周期内行为序列库中行为序列的波动,从异常检测的目的出发,能够快速定位包含“未登录”或“热度”过高的行为序列的疑似异常用户,准确率较高,适应性、时效性较强,灵活性较高。
-
公开(公告)号:CN111104521A
公开(公告)日:2020-05-05
申请号:CN201911306932.8
申请日:2019-12-18
Applicant: 上海观安信息技术股份有限公司
Abstract: 本发明实施例提供了一种基于图分析的反欺诈检测方法及系统,方法包括:1)、基于通信运营商提供的包括了受害者通信数据的通信数据,构建与通信数据中用户对应的关系图;2)、从关系图中获取受害者用户特征,并利用受害者用户特征训练随机森林分类模型,然后使用训练后的随机森林分类模型识别出待识别用户是否为受害者的结果;3)、将关系图中的除号码节点以外的其他节点收缩至对应的边或者节点中,得到目标关系图;4)、获取目标关系图中各个子连通图中对其他号码节点影响力最大的号码节点,并将对其他号码节点影响力最大的号码节点对应的用户作为诈骗犯罪分子。应用本发明实施例,可以识别出诈骗犯罪分子。
-
公开(公告)号:CN111062422A
公开(公告)日:2020-04-24
申请号:CN201911200313.0
申请日:2019-11-29
Applicant: 上海观安信息技术股份有限公司
Abstract: 本发明提供了一种套路贷体系化识别方法及装置,方法包括:1)、获取用户的网络行为数据,使用网络行为数据训练Xgboost模型,使用Xgboost模型识别出具有资金需求的用户;2)、将所述用户的历史通话数据、当前周期内通话数据以及黑名单库清单数据作为训练集训练预先构建的随机森林模型,并使用该训练好的随机森林模型输出测试集中用户属于具有寻找资金行为的用户的分类概率值;3)、根据所述用户的账户交易数据,利用贝叶斯模型输出测试集中用户为已经接收资金的用户的分类概率值;4)、将训练后的模型体系作为套路贷体系化识别模型,以对待识别用户属于套路贷受害者的概率进行检测。应用本发明实施例,可以识别出套路贷犯罪行为。
-
公开(公告)号:CN110826320A
公开(公告)日:2020-02-21
申请号:CN201911195301.3
申请日:2019-11-28
Applicant: 上海观安信息技术股份有限公司
IPC: G06F40/284 , G06F16/45 , G06F21/62
Abstract: 本发明一种基于文本识别的敏感数据发现方法,包括以下步骤:S01、样本数据提取;S02、构建训练样本,搜集文本数据集,构建训练样本;S03、训练样本标注模型,基于S02中获得训练样本,训练文本标注模型;S04、数据特征构建;S05、训练集构建,对S04得到的数据集进行标签刻画,形成用于构建分类判断模型的训练集;S06、构建分类判断模型,根据S05得到的训练集,形成变量预测模型;S07、模型测试。本发明通过对数据变量的识别,能够在数据字典和匹配规则不完整的情况下,可以精准、高效的对敏感数据进行判断识别,并保证识别和分类结果的一致性。
-
公开(公告)号:CN110784470A
公开(公告)日:2020-02-11
申请号:CN201911045663.4
申请日:2019-10-30
Applicant: 上海观安信息技术股份有限公司
IPC: H04L29/06
Abstract: 本发明实施例提供了一种用户异常登录的确定方法,所述方法包括:1)、获取登录接口日志,并将所述登录接口日志处理成结构化数据;2)、利用异常登录算法识别出发生异常的对象,其中,所述对象包括:异常登录账号、异常IP、异常MAC;3)、根据发生异常的对象,利用图数据库,构建以异常登录对象为节点的关系型网络结构图,并根据所述关系型网络结构图获取分别与异常登录对象具有连接关系的节点,将这些节点对应的账号、IP、MAC的集合作为异常登录对象。本发明实施例提供了一种用户异常登录的装置,应用本发明实施例,提高了安全性。
-
公开(公告)号:CN114254705B
公开(公告)日:2025-03-21
申请号:CN202111574028.2
申请日:2021-12-21
Applicant: 上海观安信息技术股份有限公司
IPC: G06F18/2433
Abstract: 本发明公开了一种异常数据的检测方法、装置、存储介质及计算机设备,涉及信息技术领域,主要在于能够提高异常数据的检测效率和检测精度。其中方法包括:获取待检测数据集对应的属性特征;将所述属性特征输入至预设异常检测算法预测模型中进行算法预测,得到所述待检测数据集适用的目标异常检测算法;利用所述目标异常检测算法对所述待检测数据集中的异常数据进行检测,得到所述待检测数据集对应的异常数据检测结果。本发明适用于对异常数据进行检测。
-
公开(公告)号:CN113704761B
公开(公告)日:2024-06-28
申请号:CN202111016033.1
申请日:2021-08-31
Applicant: 上海观安信息技术股份有限公司
IPC: G06F21/56
Abstract: 本发明公开了一种恶意文件的检测方法、装置、计算机设备及存储介质,涉及信息技术领域,主要在于能够减轻恶意文件检测的计算压力。其中方法包括:获取待检测文件对应的调用接口序列;确定所述调用接口序列对应的特征序列,并根据所述特征序列,确定所述待检测文件对应的最小哈希签名;根据所述待检测文件对应的最小哈希签名,将所述待检测文件分配到不同哈希区间下相应的哈希桶中,其中,任意一个哈希区间下存在多个哈希桶;确定在所述不同哈希区间下与所述待检测文件分配到同一个哈希桶中的第一目标样本文件;根据所述第一目标样本文件对应的类别信息,判定所述待检测文件是否为恶意文件。本发明适用于恶意文件的检测。
-
公开(公告)号:CN113904921B
公开(公告)日:2024-04-30
申请号:CN202111227745.8
申请日:2021-10-21
Applicant: 上海观安信息技术股份有限公司
IPC: H04L41/069 , H04L41/12 , H04L41/22 , H04L43/08 , G06F16/36
Abstract: 本发明公开一种基于日志和图的动态网络拓扑图生成方法,包括:S1,数据收集,通过流的方式收集各服务器流量、ssh、ftp、web系统日志;S2,数据解析,从步骤S1收集的各类日志中解析各服务器的特征信息;S3,图谱创建,利用步骤S2解析出的特征信息构建有向图;所述有向图的边的方向有连接发起者指向被访问服务器;S4,网络拓扑状态查询,利用步骤S3中创建的有向图,查询网络拓扑状态。本发明根据服务器之间的连接、流量等日志,解析服务器之间的关系,存在关系的服务器必然是存在数据交换的活跃状态,解析出连接关系后创建图,可以随时发现网络的变化,利用图的概念和相关算法,可用根据边进行任意时间段的网络活跃情况展示以及内网用户行为的分析。
-
-
-
-
-
-
-
-
-