-
公开(公告)号:CN111078978A
公开(公告)日:2020-04-28
申请号:CN201911209943.4
申请日:2019-11-29
Applicant: 上海观安信息技术股份有限公司
IPC: G06F16/951 , G06F16/958 , G06F40/295 , G06Q50/26
Abstract: 本发明提供一种基于网站文本内容的网贷网站实体识别方法及系统,包括S01、构建训练集域名表;S02、构建预测集域名表;S03、数据清洗与预处理;S04、文本分类模型训练,得到目标文本分类模型;S05、网贷网站识别,将预测集域名表中每个样本的目标网页内容字段输入值目标文本分类模型,输出每个样本对应的是否为网贷网站字段;S06、命名实体识别模型训练,得到目标命名实体识别模型;S07、实体名称标注。本发明基于运营商DPI数据,获取用户访问的网站域名host,获得网页内容并识别出网贷网站,同时利用命名实体识别技术提取出网贷网站中实体名称,进而结合外部黑名单数据,对一些不良网站打标,建立企业黑名单库,这种方法准确率高,时效性高。
-
公开(公告)号:CN110969202A
公开(公告)日:2020-04-07
申请号:CN201911193699.7
申请日:2019-11-28
Applicant: 上海观安信息技术股份有限公司
IPC: G06K9/62
Abstract: 本发明公开了一种基于颜色分量和感知哈希算法的人像采集环境验证方法及系统,包括S100,获取样本数据集合;S200,预处理样本数据,包括正样本和负样本;S300,针对预处理的样本数据,生成数据集D;S400,使用支持向量机分类算法结合数据集D进行分类模型训练,得到训练完成的分类模型;S500,对待检验的人像图片和环境图片,使用分类模型进行预测,输出是否匹配的预测结果。本发明采用感知哈希算法可以有效获得图像的重要内容特征,而颜色分量统计算法从颜色角度出发,弥补了前述算法对颜色信息的计算缺陷,并将两种方法所计算的相似度结果作为数据特征输入至svm模型进行训练,最终得到可以判断输入的人像图片是否为营业厅现场采集的分类模型。
-
公开(公告)号:CN110956503A
公开(公告)日:2020-04-03
申请号:CN201911201625.3
申请日:2019-11-29
Applicant: 上海观安信息技术股份有限公司
Abstract: 本发明一种基于用户网络行为的具有借贷需求的用户识别方法及装置,方法包括:1)、获取运营商记录的用户数据,得到关联后的第一特征宽表;2)、针对第一特征宽表中的每一条用户数据中的每一个主叫号码,建立主叫号码与金融机构之间的关联特征;3)、得到对应于主叫号码的样本数据,并为样本数据增加标签,将增加标签后的样板数据的集合作为第二特征宽表;4)、将第二特征宽表划分为训练集和测试集,利用训练集训练Xgboost模型,并使用测试集测试训练后的目标Xgboost模型的准确率;5)、使用目标Xgboost模型筛选出待识别数据中存在借贷需求的用户。应用本发明实施例,可以识别出具有借贷需求的用户。
-
公开(公告)号:CN110933080A
公开(公告)日:2020-03-27
申请号:CN201911200324.9
申请日:2019-11-29
Applicant: 上海观安信息技术股份有限公司
IPC: H04L29/06
Abstract: 本发明一种用户登录异常的IP群体识别方法及装置,方法包括:获取登录日志,对各个预设周期内的登录日志进行统计,获取各个IP的登录频次序列;将登录频次序列作为样本集合训练孤立森林算法,得到各个IP地址的分值;针对每一个分值,获取分值的众数,获取与众数对应的登录日志集合;从登录频次序列将对应于众数的登录日志的频次序列筛选出来,并对筛选出的频次序列进行二值化处理,得到各个IP在各个周期的标记;根据各个IP在各个周期的标记,利用kappa算法获取登录日志集合的数据之间的kappa系数,并kappa系数大于预设阈值的登录日志集合作为登录异常群体。应用本发明实施例,可以识别出IP之间相互独立的黑产行为。
-
公开(公告)号:CN110913081A
公开(公告)日:2020-03-24
申请号:CN201911195920.2
申请日:2019-11-28
Applicant: 上海观安信息技术股份有限公司
Abstract: 本发明公开了一种识别呼叫中心骚扰电话的方法及系统,具体为,先进行电话通话因子基准向量的建模,建模过程为:获取呼叫中心全量电话第一通话数据基础表,构建通话特征,生成第一通话特征宽表,生成通话因子挖掘表,生成电话号码的分类,其类中心确定为骚扰电话通话因子基准向量;然后进行骚扰电话识别,具体为:获取待识别电话的第二通话数据基础表;生成第二通话特征宽表,再生成待识别电话的通话因子向量,计算骚扰电话通话因子基准向量与通话因子向量之间的相似度。建模过程仅需要一次聚类和专家经验,此后不再需要人工参与,降低主观性;识别过程仅提取待识别电话的短周期通话数据,数据获取工作量小、运算量小、耗时短。
-
公开(公告)号:CN110889283A
公开(公告)日:2020-03-17
申请号:CN201911200342.7
申请日:2019-11-29
Applicant: 上海观安信息技术股份有限公司
IPC: G06F40/284 , G06F21/62
Abstract: 本发明提供一种系统审批理由随意性检测方法及系统,包括以下步骤:S100.获取审批操作日志历史数据并解析,至少获得审批原因文本数据;S200.规则检测,根据预先规定的规则判断,检测出异常审批原因数据,遍历所有数据获得异常数据集合A;S300.文本分析,对审批原因文本数据进行分词、相似度得分计算、计算每条审批操作日志历史数据的平均分,遍历所有历史数据,获得异常审批原因数据集合B;S400.A∪B得到审批操作日志历。本发明从审核理由文本数据本身入手,结合规则判断和文本分词之间相似度得分计算,检测审核理由的随意性和合理性。本实施例采用两种检测方法,全面的将所有可能出现的异常情况考虑进来,检测精度高。
-
公开(公告)号:CN113705714B
公开(公告)日:2024-06-11
申请号:CN202111031013.1
申请日:2021-09-03
Applicant: 上海观安信息技术股份有限公司
IPC: G06F18/2433 , G06N5/025
Abstract: 本发明公开了基于行为序列的配电物联网设备异常行为检测方法及装置,所述方法包括:获取配电物联网设备的样本数据集;根据样本数据集对所有的配电物联网设备进行分组;根据样本数据集获取以设备ID为主体对象的数据集R,所述数据集R中包括与设备ID对应的行为序列数据以及类别标签;建立异常行为组合库,根据分组结果,分别将同组设备的行为序列数据与对应的异常行为组合库进行比对,并根据比对结果判定各设备是否异常,并将各个设备是否异常的标签合并至数据表R中得到数据表Rx;对于已识别异常行为的设备,判断已识别异常行为属于何种类型的安全威胁并处理;本发明的优点在于:使用范围广,检测效率高。
-
公开(公告)号:CN110956503B
公开(公告)日:2024-02-23
申请号:CN201911201625.3
申请日:2019-11-29
Applicant: 上海观安信息技术股份有限公司
Abstract: 本发明一种基于用户网络行为的具有借贷需求的用户识别方法及装置,方法包括:1)、获取运营商记录的用户数据,得到关联后的第一特征宽表;2)、针对第一特征宽表中的每一条用户数据中的每一个主叫号码,建立主叫号码与金融机构之间的关联特征;3)、得到对应于主叫号码的样本数据,并为样本数据增加标签,将增加标签后的样板数据的集合作为第二特征宽表;4)、将第二特征宽表划分为训练集和测试集,利用训练集训练Xgboost模型,并使用测试集测试训练后的目标Xgboost模型的准确率;5)、使用目标
-
公开(公告)号:CN111913864B
公开(公告)日:2023-10-13
申请号:CN202010820755.1
申请日:2020-08-14
Applicant: 上海观安信息技术股份有限公司
IPC: G06F11/34
Abstract: 本发明提供了一种基于业务操作组合发现异常操作行为的方法,包括以下步骤:步骤A:提取业务操作和受理日志的历史数据;步骤B:基于业务对象和操作时间间隔构建操作序列;步骤C:剔除业务层面罕见的正常操作,生成操作组合;步骤D:针对指定业务操作类型获取相关的操作组合;步骤E:利用关联规则提取异常项,发现异常操作行为及对应的操作人员。本发明还提供了基于该方法的装置。本发明的优点在于:在没有明确的异常操作样本的情况下,通过划分会话,构建操作组合,基于关联规则进行异常检测,实现了对业务操作异常的发现,具有良好的适应性和推广前景。
-
公开(公告)号:CN111062422B
公开(公告)日:2023-07-14
申请号:CN201911200313.0
申请日:2019-11-29
Applicant: 上海观安信息技术股份有限公司
IPC: G06F18/2431 , G06F18/214 , G06F18/2415 , G06Q50/26
Abstract: 本发明提供了一种套路贷体系化识别方法及装置,方法包括:1)、获取用户的网络行为数据,使用网络行为数据训练Xgboost模型,使用Xgboost模型识别出具有资金需求的用户;2)、将所述用户的历史通话数据、当前周期内通话数据以及黑名单库清单数据作为训练集训练预先构建的随机森林模型,并使用该训练好的随机森林模型输出测试集中用户属于具有寻找资金行为的用户的分类概率值;3)、根据所述用户的账户交易数据,利用贝叶斯模型输出测试集中用户为已经接收资金的用户的分类概率值;4)、将训练后的模型体系作为套路贷体系化识别模型,以对待识别用户属于套路贷受害者的概率进行检测。应用本发明实施例,可以识别出套路贷犯罪行为。
-
-
-
-
-
-
-
-
-