-
公开(公告)号:CN110766091A
公开(公告)日:2020-02-07
申请号:CN201911049749.4
申请日:2019-10-31
Applicant: 上海观安信息技术股份有限公司
Abstract: 本发明实施例提供了一种套路贷团伙的识别方法及系统,方法包括:1)、获取套路贷运行过程中涉及到的特征数据;2)、将特征数据中包含的关键词作为节点,根据各个节点间的关系构建包括各个节点的关系图;3)、将关系图中的节点中的非人物节点收缩至对应于非人物节点的人物节点中;4)、根据各个人物节点之间边的类型确定边的权重的大小,将关系图划分为若干个节点集;5)、针对每一个节点集,将节点集与预先确定的套路贷犯罪分子的数据的重合程度,获取节点集中的节点为套路贷团伙成员的概率,并将概率大于预设阈值的节点集对应的人物作为套路贷团伙成员。应用本发明实施例,可以根据现有的套路贷犯罪分子的数据识别与对应的套路贷团伙。
-
公开(公告)号:CN111078978B
公开(公告)日:2024-02-27
申请号:CN201911209943.4
申请日:2019-11-29
Applicant: 上海观安信息技术股份有限公司
IPC: G06F16/951 , G06F16/958 , G06F40/295 , G06Q50/26
Abstract: 本发明提供一种基于网站文本内容的网贷网站实体识别方法及系统,包括S01、构建训练集域名表;S02、构建预测集域名表;S03、数据清洗与预处理;S04、文本分类模型训练,得到目标文本分类模型;S05、网贷网站识别,将预测集域名表中每个样本的目标网页内容字段输入值目标文本分类模型,输出每个样本对应的是否为网贷网站字段;S06、命名实体识别模型训练,得到目标命名实体识别模型;S07、实体名称标注。本发明基于运营商DPI数据,获取用户访问的网站域名host,获得网页内容并识别出网贷网站,同时利用命名实体识别技术提取出网贷网站中实体名称,进而结合外部黑名单数据,对一些不良网站打标,建立企业黑名单库,这种方法准确率高,
-
公开(公告)号:CN112733140B
公开(公告)日:2023-12-22
申请号:CN202011605328.8
申请日:2020-12-28
Applicant: 上海观安信息技术股份有限公司
IPC: G06F21/56 , G06F21/64 , G06F18/22 , G06F18/214
Abstract: 本发明一种针对模型倾斜攻击的检测方法及系统,包括以下步骤:步骤S1,获取被篡改的训练数据集data11,测试数据集data22;步骤S2,对数据集样本进行分词处理,得到N维的样本数据特征向量V;步骤S3,对N维的样本数据特征向量V进行编码,生成样本指纹;步骤S4,对所得到的指纹进行相似度匹配,得到相似度高的样本集即为篡改数据。本发明所提供的一种针对存在大量相似文本的训练数据导致模型分类产生倾斜的攻击方式的检测方法,通过人为修改样本数据,保证样本数据存在大量重复,样本数据更准确,基于指纹相似度匹配可快速识别。另外,本发明所提供的检测方法还可应用在模型反馈机制武器化的检测上,通过对海量反馈信息进行相似度匹(56)对比文件姜雪等.基于语义指纹的海量文本快速相似检测算法研究《.电脑知识与技术》.2016,(第36期),
-
公开(公告)号:CN110969202B
公开(公告)日:2023-12-19
申请号:CN201911193699.7
申请日:2019-11-28
Applicant: 上海观安信息技术股份有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/74
Abstract: 本发明公开了一种基于颜色分量和感知哈希算法的人像采集环境验证方法及系统,包括S100,获取样本数据集合;S200,预处理样本数据,包括正样本和负样本;S300,针对预处理的样本数据,生成数据集D;S400,使用支持向量机分类算法结合数据集D进行分类模型训练,得到训练完成的分类模型;S500,对待检验的人像图片和环境图片,使用分类模型进行预测,输出是否匹配的预测结果。本发明采用感知哈希算法可以有效获得图像的重要内容特征,而颜色分量统计算法从颜色角度出发,弥补了前述算法对颜色信息的计算缺陷,并将两种方法所计算的相似度结(56)对比文件Choi, YS ET AL.Image hash generationmethod using hierarchical histogram.《MultiMedia Tools and applications》.2012,赵佳等.结合裁剪技术的颜色特征匹配搜索《.宜宾学院学报》.2016,(第06期),
-
公开(公告)号:CN117155617A
公开(公告)日:2023-12-01
申请号:CN202311036141.4
申请日:2023-08-16
Applicant: 上海观安信息技术股份有限公司
IPC: H04L9/40 , H04L61/4511
Abstract: 本发明提供一种基于DNS日志分析的APT组织检测方法及装置,属于网络安全技术领域。通过引入多模块深层次分析APT的方法,以DNS日志数据为媒介,构造多个分析模块,围绕APT攻击的行为特点进行分析,然后通过模型整合的方式将各个模块的结果综合考虑,最后通过判断模块是否为攻击行为并对APT攻击进行组织划分和溯源,有效弥补了现有方法依赖数据库时效性较差、不能控制模型漏报率、无法控制检测结果准确率的问题。
-
公开(公告)号:CN113378156B
公开(公告)日:2023-07-11
申请号:CN202110749396.X
申请日:2021-07-01
Applicant: 上海观安信息技术股份有限公司
IPC: G06F21/53 , G06F18/214 , G06F18/24 , G06F9/448
Abstract: 本发明提供一种基于API的恶意文件检测方法和系统,所述方法包括如下步骤:将文件放入沙箱中运行,同时记录文件运行时调用的API名称、tid以及线程中API调用的顺序编号index;数据预处理,包括:对数据中的API进行处理、低频率API优化处理、新字段的生成、标签编码映射;基于处理后的数据构建特征工程,包括全局特征和局部组合特征,两部分特征集合最终拼接成一个特征集合;根据模型初次训练结果将部分杀毒软件无法判定的文件修正为“正常”的记录数,进而再次训练模型;模型预测。本发明还提供一种基于API的恶意文件检测系统。本发明对各种绕过特征码、沙箱检测的恶意文件具有一定的识别率,能够提高恶意文件检测的泛化能力。
-
公开(公告)号:CN116187423A
公开(公告)日:2023-05-30
申请号:CN202310226595.1
申请日:2023-03-07
Applicant: 上海观安信息技术股份有限公司
Abstract: 本发明提供一种基于无监督算法的行为序列异常检测方法及系统,方法包括:本发明基于企业web系统操作数据,标准化处理成web用户操作表;通过用户操作的先后顺序,等时间间隔对用户行为序列进行分割,形成多个时间窗口的子序列;根据web用户操作表,再获取近4天的历史数据,对每天每个用户,按照操作顺序合并一天内的操作行为生成序列;进而计算每个子序列与其前后相邻窗口的子序列的相似度以及每个行为序列与其近3天内行为序列的相似度;将子序列间的相似度值以及序列间的相似度值作为特征即孤立森林模型的输入,根据模型输出结果确定用户是否异常。本发明解决了行为序列异常捕捉困难、误报、漏报率较高的技术问题。
-
公开(公告)号:CN113726786B
公开(公告)日:2023-05-05
申请号:CN202111014056.9
申请日:2021-08-31
Applicant: 上海观安信息技术股份有限公司
IPC: H04L9/40
Abstract: 本申请公开了一种异常访问行为的检测方法、装置、存储介质及电子设备。其中方法包括:构建以网络地址为节点的访问行为图谱;基于目标设备的网络地址以及所述访问行为图谱,获取所述目标设备的若干访问路径;基于各所述访问路径的节点数进行异常访问行为的判断,获得异常访问行为的检测结果。本申请中,通过构建访问行为图谱,然后根据目标设备的网络地址来从该访问行为图谱中获取目标设备的访问路径,并根据各路径中节点数的多少来确定该路径是否存在访问异常行为,由此使得最终的检测结果更加准确、合理。
-
公开(公告)号:CN114139540A
公开(公告)日:2022-03-04
申请号:CN202110971541.9
申请日:2021-08-23
Applicant: 上海观安信息技术股份有限公司
IPC: G06F40/295 , G06N3/04 , G06F40/216 , G06F16/35
Abstract: 本申请公开了一种基于人工智能模型的敏感数据探测评估系统,包括:获取模块,用于获取原始数据;识别模块,用于基于预先训练的模型来对所述原始数据进行识别得到敏感数据。本申请的技术方案,提高了敏感数据的识别的精确度。
-
公开(公告)号:CN114004297A
公开(公告)日:2022-02-01
申请号:CN202111286282.2
申请日:2021-11-02
Applicant: 上海观安信息技术股份有限公司
Abstract: 本发明实施例公开了一种投毒数据识别方法、装置、系统及计算机可读存储介质,其中所述方法包括:获取参照干净数据集Dclean以及初始测试数据集Dtarget;将所述初始测试数据集Dtarget中,原标注标签与数据内容不一致的数据记为标签修改的投毒数据,将所述标签修改的投毒数据从所述初始测试数据集Dtarget中剔除,得到标准测试数据集D′target;根据所述参照干净数据集Dclean,将所述标准测试数据集D′target中,数据内容添加了扰动或后门触发器的数据标记为标签不变的投毒数据;删除所述标准测试数据集D′target中标签不变的投毒数据,得到纯净数据集。本发明对初始测试数据集中的标签修改投毒数据和标签不变投毒数据进行分别识别、删除,提高了投毒数据的识别准确率。
-
-
-
-
-
-
-
-
-