-
公开(公告)号:CN108268785B
公开(公告)日:2020-05-22
申请号:CN201611254013.7
申请日:2016-12-30
Applicant: 广东精点数据科技股份有限公司
IPC: G06F21/62
Abstract: 本发明提供一种敏感数据识别和脱敏的装置及方法,其装置包括:输入单元,用于响应当前触发的数据脱敏请求,获取待脱敏的目标数据;识别单元,用于识别待脱敏的目标数据是否为敏感数据,若是,则执行数据脱敏单元,否则直接执行输出单元;所述数据脱敏单元,用于对已识别为敏感数据的目标数据执行脱敏操作;所述输出单元,用于输出处理后不具敏感性的目标数据。本发明的有益效果在于,利用NBM建立分类器实现对敏感数据的识别,避免对非敏感数据进行脱敏操作造成的运算负担;采用变形和交换相结合的方法对敏感数据脱敏,只需对敏感数据中的小部分数据记录按照脱敏规则进行数据变形,再利用交换实现对所有数据的脱敏,大大减少了运算量。
-
公开(公告)号:CN108270719A
公开(公告)日:2018-07-10
申请号:CN201611254437.3
申请日:2016-12-30
Applicant: 广东精点数据科技股份有限公司
Abstract: 本发明提供一种基于数字签名的数据安全传输方法及装置,其装置包括触发单元、数据发送单元和数据接收单元;所述触发单元,用于响应当前触发的数据传输请求;所述数据发送单元,用于将所述目标数据从第一客户端发送到所述第二客户端;所述数据接收单元,用于接收从所述第一客户端发来的目标数据。本发明的有益效果在于,所述触发单元对所述第一客户端访问数据库的权限进行判断,保证了数据访问的安全,对所述第二客户端标识符指向的位置信息合法性进行判断,提高了数据传输的效率;所述第二客户端根据附加的数字签名确认数据来源的安全和数据的完整性,从而保证了数据在传输过程中的安全性。
-
公开(公告)号:CN108269102A
公开(公告)日:2018-07-10
申请号:CN201611253992.4
申请日:2016-12-30
Applicant: 广东精点数据科技股份有限公司
Abstract: 本发明公开一种基于爬虫技术与购物分析相结合的目标营销方法,其包括:步骤a:购物篮分析:对电子商务网站内所有用户的购物篮数据进行关联挖掘;步骤b:网络爬虫分析:对网页进行分析,提取网页关键字;步骤c:关键字与关联规则匹配;步骤d,将相关产品信息向用户推送;还公开了一种与基于爬虫技术与购物分析相结合的目标营销方法相对应的装置。这样,本方法和装置实现了基于网络爬虫和购物篮分析的目标营销,针对只用购物篮分析无法定位消费者的具体需求的不足,在该基础上添加网络爬虫技术来判断消费者感兴趣的产品,从而实现对某些特定产品的营销。
-
公开(公告)号:CN108268467A
公开(公告)日:2018-07-10
申请号:CN201611254436.9
申请日:2016-12-30
Applicant: 广东精点数据科技股份有限公司
Abstract: 本发明提供一种基于属性的异常数据检测方法和装置,该方法包括步骤S1:数据属性的预处理;步骤S2:分析数据对象的各种属性,对数据进行异常检测;步骤S3:利用异常标记数组对数据集进行分离,将异常数据从原始数据集中移动到异常数据集中,并输出。与现有技术相比:本发明提供了一种基于属性的异常数据检测方法和装置,融合了基于距离的异常数据检测方法和基于密度的异常数据检测方法,适用于复杂数据的检测,提高了检测的效率,简化了参数的设置,避免了基于密度的异常数据的检测方法的只能检测局部异常数据的局限性,保证了异常数据检测的准确率,方便了用户的使用。
-
公开(公告)号:CN119398901A
公开(公告)日:2025-02-07
申请号:CN202411975884.2
申请日:2024-12-31
Applicant: 广东精点数据科技股份有限公司
IPC: G06Q40/02
Abstract: 本申请涉及数智化的技术领域,尤其涉及一种银行数智模型赋能平台及数智化系统。本申请首先通过基准阈值获取模块建立各类模型的性能基准标准,然后基于模型稳定系数获取模块对历史数据进行深度分析,量化模型在不同场景下的稳定性特征,继而通过监控阈值更新模块将稳定系数与基准阈值相结合生成动态阈值,最后由阈值调整模块实现监控标准的自适应更新,能够根据模型的历史表现特征和当前业务场景自动调整监控策略,显著提升了模型监控的准确性和实用性。
-
公开(公告)号:CN114970649B
公开(公告)日:2024-07-26
申请号:CN202110201619.9
申请日:2021-02-23
Applicant: 广东精点数据科技股份有限公司
IPC: G06F18/23213 , G06F18/22
Abstract: 本发明公开了一种基于聚类算法的网络信息处理方法,涉及信息处理技术领域。具体包括获取初始数据,设定所述初始数据的中心点,根据所述中心点将初始数据划分成至少两个初始簇;计算各初始簇中的数据与该初始簇的中心点之间的距离并形成距离矩阵,根据该距离矩阵获取数据相似性的权重;根据数据相似性的权重对参数进行调整和数据更新并生成新的簇。旨在自动对不完整的多数据形态信息将信息进行分类,以将缺少部分信息的同类数据融合在一起,以得到包含所有信息的数据,方便信息提取和应用。
-
公开(公告)号:CN108268458B
公开(公告)日:2020-12-08
申请号:CN201611253977.X
申请日:2016-12-30
Applicant: 广东精点数据科技股份有限公司
IPC: G06F16/35
Abstract: 本发明公开一种基于KNN算法的半结构化数据分类方法及装置,该方法包括:步骤S1,将训练集中的所有训练半结构化数据都表示成计算机能够识别的数据向量;步骤S2,得到该类别的类中心向量;步骤S3,接收测试半结构化数据后,将所述测试半结构化数据表示为所述数据向量;步骤S4,计算所述测试半结构化数据与训练集中每个类的类中心向量的距离;步骤S5,计算对应的相似度;步骤S6,将所述测试半结构化数据归类为与其相似度最大的类中;该装置包括对应的训练转换单元、类中心向量计算单元、测试转换单元、距离计算单元、相似度计算单元和分类单元。这样,引入测试半结构化数据与训练半结构化数据所在类的相似性,使得分类结果准确,且提高了分类精度。
-
公开(公告)号:CN108268785A
公开(公告)日:2018-07-10
申请号:CN201611254013.7
申请日:2016-12-30
Applicant: 广东精点数据科技股份有限公司
IPC: G06F21/62
Abstract: 本发明提供一种敏感数据识别和脱敏的装置及方法,其装置包括:输入单元,用于响应当前触发的数据脱敏请求,获取待脱敏的目标数据;识别单元,用于识别待脱敏的目标数据是否为敏感数据,若是,则执行数据脱敏单元,否则直接执行输出单元;所述数据脱敏单元,用于对已识别为敏感数据的目标数据执行脱敏操作;所述输出单元,用于输出处理后不具敏感性的目标数据。本发明的有益效果在于,利用NBM建立分类器实现对敏感数据的识别,避免对非敏感数据进行脱敏操作造成的运算负担;采用变形和交换相结合的方法对敏感数据脱敏,只需对敏感数据中的小部分数据记录按照脱敏规则进行数据变形,再利用交换实现对所有数据的脱敏,大大减少了运算量。
-
公开(公告)号:CN108268548A
公开(公告)日:2018-07-10
申请号:CN201611270556.8
申请日:2016-12-30
Applicant: 广东精点数据科技股份有限公司
Abstract: 本发明公开一种基于树状图的数据相似度匹配方法及装置,其方法包括:步骤S1,对需要进行相似度匹配的数据,建立以所述数据为部分节点的树状图;步骤S2,以信息量为基础,对所述数据进行相似度计算;步骤S3,以属性为基础,对所述数据进行相似度计算;步骤S6,对所述数据相似度进行加权计算,得到总相似度;其装置包括对应的树状图建立单元、信息量相似度计算单元、属性相似度计算单元和总相似度计算单元。这样,可以综合影响所述数据相似度的多个因素,得到更准确的总相似度。
-
公开(公告)号:CN108268478A
公开(公告)日:2018-07-10
申请号:CN201611257589.9
申请日:2016-12-30
Applicant: 广东精点数据科技股份有限公司
Abstract: 本发明公开一种基于ur-CAIM算法的不平衡数据集特征选择方法,其包括:步骤a:定义数据集合;步骤b:计算初始CAIM准则,即数据集类别标签集合与数据集连续属性之间的相关性;步骤c:计算类别标签集合与数据集连续属性之间的互信息;步骤d:计算CAIR准则:步骤e:计算CAIU准则;步骤f:对CAIM准则进行改进;步骤g,根据改进的CAIM准则计算离散值、计算属性F的IV值,并设定阈值e,将IV值大于e的属性作为后续建模需要的特征;本发明还公开一种与基于ur-CAIM算法的不平衡数据集特征选择方法相对应的装置。这样,本发明利用改进的CAIM准则对连续属性离散化,挑选出了对后续建模有重要作用的特征变量,减少了异常值对模型的影响,具有一定的稳健性。
-
-
-
-
-
-
-
-
-