-
公开(公告)号:CN113378156B
公开(公告)日:2023-07-11
申请号:CN202110749396.X
申请日:2021-07-01
Applicant: 上海观安信息技术股份有限公司
IPC: G06F21/53 , G06F18/214 , G06F18/24 , G06F9/448
Abstract: 本发明提供一种基于API的恶意文件检测方法和系统,所述方法包括如下步骤:将文件放入沙箱中运行,同时记录文件运行时调用的API名称、tid以及线程中API调用的顺序编号index;数据预处理,包括:对数据中的API进行处理、低频率API优化处理、新字段的生成、标签编码映射;基于处理后的数据构建特征工程,包括全局特征和局部组合特征,两部分特征集合最终拼接成一个特征集合;根据模型初次训练结果将部分杀毒软件无法判定的文件修正为“正常”的记录数,进而再次训练模型;模型预测。本发明还提供一种基于API的恶意文件检测系统。本发明对各种绕过特征码、沙箱检测的恶意文件具有一定的识别率,能够提高恶意文件检测的泛化能力。
-
公开(公告)号:CN113726786B
公开(公告)日:2023-05-05
申请号:CN202111014056.9
申请日:2021-08-31
Applicant: 上海观安信息技术股份有限公司
IPC: H04L9/40
Abstract: 本申请公开了一种异常访问行为的检测方法、装置、存储介质及电子设备。其中方法包括:构建以网络地址为节点的访问行为图谱;基于目标设备的网络地址以及所述访问行为图谱,获取所述目标设备的若干访问路径;基于各所述访问路径的节点数进行异常访问行为的判断,获得异常访问行为的检测结果。本申请中,通过构建访问行为图谱,然后根据目标设备的网络地址来从该访问行为图谱中获取目标设备的访问路径,并根据各路径中节点数的多少来确定该路径是否存在访问异常行为,由此使得最终的检测结果更加准确、合理。
-
公开(公告)号:CN113836370B
公开(公告)日:2022-03-01
申请号:CN202111412279.0
申请日:2021-11-25
Applicant: 上海观安信息技术股份有限公司
IPC: G06F16/9035 , G06F16/906 , G06N20/00
Abstract: 本发明公开了一种用户群体的分类方法、装置、存储介质及计算机设备。其中方法包括:获取用户群体的行为数据,并对用户群体的行为数据进行预处理,得到以每个用户的用户名为主体对象的行为序列数据集;利用关联分析算法,对行为序列数据集中的频繁行为指令组合进行提取和频次统计,得到频繁指令组合特征表;通过序列对比算法,计算行为序列数据集中的各个行为序列之间的序列匹配分值和序列间相似度分值,得到序列相似性特征表;对行为序列数据集中的行为指令进行频次统计,得到行为指令频次特征表;采用半监督分类算法,对频繁指令组合特征表、序列相似性特征表和行为指令频次特征表进行分类分析,得到具有不同类别的用户群体,以提高分类效率。
-
公开(公告)号:CN114004297A
公开(公告)日:2022-02-01
申请号:CN202111286282.2
申请日:2021-11-02
Applicant: 上海观安信息技术股份有限公司
Abstract: 本发明实施例公开了一种投毒数据识别方法、装置、系统及计算机可读存储介质,其中所述方法包括:获取参照干净数据集Dclean以及初始测试数据集Dtarget;将所述初始测试数据集Dtarget中,原标注标签与数据内容不一致的数据记为标签修改的投毒数据,将所述标签修改的投毒数据从所述初始测试数据集Dtarget中剔除,得到标准测试数据集D′target;根据所述参照干净数据集Dclean,将所述标准测试数据集D′target中,数据内容添加了扰动或后门触发器的数据标记为标签不变的投毒数据;删除所述标准测试数据集D′target中标签不变的投毒数据,得到纯净数据集。本发明对初始测试数据集中的标签修改投毒数据和标签不变投毒数据进行分别识别、删除,提高了投毒数据的识别准确率。
-
公开(公告)号:CN113448955B
公开(公告)日:2021-12-07
申请号:CN202110999774.X
申请日:2021-08-30
Applicant: 上海观安信息技术股份有限公司
IPC: G06F16/215
Abstract: 本发明公开了一种数据集质量评估方法、装置、计算机设备及存储介质,涉及信息技术领域,主要在于能够提高数据集质量的评估精度和评估效率。其中方法包括:获取数据集中的待评估数据;分别统计所述待评估数据在多个评估维度下的属性特征;基于所述多个评估维度下的属性特征,对所述待评估数据进行质量评估,得到所述待评估数据分别在所述多个评估维度下的质量评估结果。本发明适用于数据集质量的评估。
-
公开(公告)号:CN113032824A
公开(公告)日:2021-06-25
申请号:CN202110224544.6
申请日:2021-03-01
Applicant: 上海观安信息技术股份有限公司
Abstract: 本发明提供一种基于数据库流量日志的低频数据泄漏检测方法及系统,将同一源IP地址对应相同的源端口及相同时间所产生的操作行为定义为同一用户操作行为。本发明先通过行为数据进行聚类,并根据每个类的用户,学习他们的查询的表的特征,并且特征为非频率性特征,在每个类中找到某个用户查询行为和其他用户查询行为不一致的情况,从而实现检测低频率的数据泄漏情况。
-
公开(公告)号:CN112714080A
公开(公告)日:2021-04-27
申请号:CN202011543625.4
申请日:2020-12-23
Applicant: 上海观安信息技术股份有限公司
IPC: H04L12/851 , H04L12/24 , G06K9/62
Abstract: 本发明一种基于spark图算法的互连关系分类方法,包括生成节点数据表V和关系数据表E;基于节点数据表V和关系数据表E,应用Spark图算法,生成图关系G;使用Lovain算法进行通信群体发现;结合业务进行群体标签设置,进行群体分类;并筛选游离关系记为游离关系表P。还提供基于该方法的系统。本发明采用将电力终端通信网络映射为以IP为结点,通信关系为边,IP发送指令相似度为边权值的有向加权网络,采用了经典社区分类算法Louvain进行社群挖掘,同时设计了基于设备通信指令相似度的关系权重,作为明显特征,有效提高了算法分类效果,最终可以准确高效的完成通信设备之间互连关系分类,获得分类明显的通信群体。
-
公开(公告)号:CN112418355A
公开(公告)日:2021-02-26
申请号:CN202011480846.1
申请日:2020-12-16
Applicant: 上海观安信息技术股份有限公司
Abstract: 本发明提供一种基于孤立森林算法对异常点进行异常特征分析的方法及系统,数据安全技术领域。包括以下步骤:对每个数据点,获取其在每棵树上的分支路径所使用的切分特征序列;依据在特征序列上出现的位置和次数,计算每个特征的重要性,对特征进行排序;依据孤立森林输出的异常概率选取异常点,再依据排序后特征序列,输出异常点的TOP特征。本发明基于孤立森林算法思想,对异常点进行深入解释,通过计算特征序列上的每个特征的重要性,然后根据重要性对特征进行排序,最后输出异常点的TOP特征,即可确定异常点的异常维度,有助于在实际业务场景中对异常点进行业务解释和归类,帮助数据分析人员和业务人员对业务异常进行总结和归纳。
-
公开(公告)号:CN111814436A
公开(公告)日:2020-10-23
申请号:CN202010731634.X
申请日:2020-07-27
Applicant: 上海观安信息技术股份有限公司
IPC: G06F40/151 , G06F40/216 , H04L29/06 , H04L29/08
Abstract: 本发明提供一种基于互信息和熵的用户行为序列检测方法,基于web系统操作日志数据,根据用户行为序列,通过互信息及熵获得专业行为序列库,再通过行为序列的波动检测疑似异常用户的过程,一方面,该方法是一种无监督的方法,适应性较强,不需要业务经验,能够很快获得网站的专有行为序列库;另一方面,通过比较两个周期内行为序列库中行为序列的波动,从异常检测的目的出发,能够快速定位包含“未登录”或“热度”过高的行为序列的疑似异常用户,准确率较高,适应性、时效性较强,灵活性较高。
-
公开(公告)号:CN111104521A
公开(公告)日:2020-05-05
申请号:CN201911306932.8
申请日:2019-12-18
Applicant: 上海观安信息技术股份有限公司
Abstract: 本发明实施例提供了一种基于图分析的反欺诈检测方法及系统,方法包括:1)、基于通信运营商提供的包括了受害者通信数据的通信数据,构建与通信数据中用户对应的关系图;2)、从关系图中获取受害者用户特征,并利用受害者用户特征训练随机森林分类模型,然后使用训练后的随机森林分类模型识别出待识别用户是否为受害者的结果;3)、将关系图中的除号码节点以外的其他节点收缩至对应的边或者节点中,得到目标关系图;4)、获取目标关系图中各个子连通图中对其他号码节点影响力最大的号码节点,并将对其他号码节点影响力最大的号码节点对应的用户作为诈骗犯罪分子。应用本发明实施例,可以识别出诈骗犯罪分子。
-
-
-
-
-
-
-
-
-