一种垃圾短信的过滤方法及装置

    公开(公告)号:CN108093376A

    公开(公告)日:2018-05-29

    申请号:CN201611027840.2

    申请日:2016-11-21

    Abstract: 本发明公开了一种垃圾短信的过滤方法及装置,通过对获取到的短信文本提取各类噪音特征,计算各类噪音特征在短信文本中的权重,构建各类噪音特征的向量空间;再将其输送至决策树分类器中,根据各类噪音特征的向量空间,以及预先训练完成的决策树分类器,确定各类噪音特征的向量空间是否满足决策树分类器中垃圾短信的分类条件,当确定各类噪音特征的向量空间满足垃圾短信的分类条件时,即可以确认获取到的短信文本为垃圾短信。因此,该方法通过对噪音特征的挖掘,实现了对短信文本中存在的特殊文本形式进行分类,灵活地应对垃圾短信中文本内容的形式多样化,提高了垃圾短信过滤的准确率,进而减少了用户接收到垃圾短信的几率,提高了用户的体验。

    一种分布式文件系统、数据访问和数据存储的方法及装置

    公开(公告)号:CN107992491A

    公开(公告)日:2018-05-04

    申请号:CN201610949569.1

    申请日:2016-10-26

    Inventor: 任兰芳 张星

    Abstract: 本申请涉及数据处理领域,尤其涉及一种分布式文件系统、数据访问和数据存储的方法及装置,用以解决现有技术中HDFS集群的架构在NameNode出现故障的情况下会导致整个HDFS无法正常工作的问题;本申请实施例提供的系统包括:上层名字节点,多个下层名字节点以及多个数据节点;上层名字节点,用于接收客户端发送的数据访问请求,基于客户端与下层名字节点的映射关系将数据访问请求转发至与客户端对应的下层名字节点;下层名字节点,用于接收由上层名字节点转发的数据访问请求,并查找数据访问请求对应的数据节点,将查找到的数据节点的信息返回至客户端;数据节点,用于向客户端提供与数据访问请求相对应的数据信息。

    数据安全处理方法及装置

    公开(公告)号:CN108073821B

    公开(公告)日:2021-08-06

    申请号:CN201610987078.6

    申请日:2016-11-09

    Abstract: 本发明实施例公开了一种数据安全处理方法及装置,所述方法包括:接收请求终端发送的数据请求;解析所述数据请求,依据脱敏规则确定请求的数据是否包括敏感数据;当请求的数据包括所述敏感数据时,获取所述敏感数据的敏感关联规则;根据所述敏感关联规则,确定是否有导致所述敏感数据出现脱敏失效或脱敏减弱的风险;当确定出有导致所述敏感数据出现脱敏失效或脱敏减弱的风险时,执行安全防御操作。在本实施例中会对敏感数据的脱敏失效或脱敏减弱进行防御处理,防止因为脱敏失效或脱敏减弱导致的敏感数据的泄露带来的信息泄露或非法窃取,提升了敏感信息的安全性。

    数据安全处理方法及装置

    公开(公告)号:CN108073821A

    公开(公告)日:2018-05-25

    申请号:CN201610987078.6

    申请日:2016-11-09

    Abstract: 本发明实施例公开了一种数据安全处理方法及装置,所述方法包括:接收请求终端发送的数据请求;解析所述数据请求,依据脱敏规则确定请求的数据是否包括敏感数据;当请求的数据包括所述敏感数据时,获取所述敏感数据的敏感关联规则;根据所述敏感关联规则,确定是否有导致所述敏感数据出现脱敏失效或脱敏减弱的风险;当确定出有导致所述敏感数据出现脱敏失效或脱敏减弱的风险时,执行安全防御操作。在本实施例中会对敏感数据的脱敏失效或脱敏减弱进行防御处理,防止因为脱敏失效或脱敏减弱导致的敏感数据的泄露带来的信息泄露或非法窃取,提升了敏感信息的安全性。

    信息处理方法、装置、设备及存储介质

    公开(公告)号:CN115994848A

    公开(公告)日:2023-04-21

    申请号:CN202111210350.7

    申请日:2021-10-18

    Abstract: 本发明公开了一种信息处理方法、装置、设备及存储介质。其中,所述方法包括:获取水印信息和结构化数据集;对所述水印信息进行分割,得到N个水印分片;并对所述结构化数据集中的元组数据进行分组,得到两个第一分组;每个第一分组包含N个第二分组;N为正整数;针对每个第一分组,生成与相应第一分组中各个第二分组对应的伪行数据,得到与相应第一分组对应的N个伪行数据;针对每个第一分组,将所述N个水印分片分别嵌入到与相应第一分组对应的N个伪行数据中。

    水印插入方法、提取方法及装置

    公开(公告)号:CN114722360A

    公开(公告)日:2022-07-08

    申请号:CN202110001452.1

    申请日:2021-01-04

    Abstract: 本发明提供了一种水印插入方法、提取方法及装置,属于数据安全技术领域。水印插入方法包括:编码得到水印信息,使用门限秘密分享算法将所述水印信息分割为N个水印分片;选择待添加水印信息的结构化数据的数值型属性m来存储水印信息;设置布隆过滤器B,随机生成一条主键值唯一的伪数据记录,将所述伪数据记录的数值型属性m替换为第j个水印分片,将所述伪数据记录写入所述布隆过滤器B,将所述伪数据记录添加到所述结构化数据中。本发明的技术方案能够提升水印算法的鲁棒性。

    一种类候选键的确定方法和电子设备

    公开(公告)号:CN112446043A

    公开(公告)日:2021-03-05

    申请号:CN201910817067.7

    申请日:2019-08-30

    Abstract: 本发明提供一种类候选键的确定方法和电子设备,所述方法包括:基于预设取样率,从数据集中获取预设数量的元组;对所述数据集中的属性进行组合,并针对所述预设数量的元组计算所述组合得到的属性组合的第一置信率,将所述第一置信率大于或等于预设置信率的属性组合作为类候选键;其中,所述属性组合的置信率为所述属性组合能够标识出唯一元组的比例。通过本发明提供的类候选键的确定方法和电子设备,能够通过设置置信率,筛选满足置信率条件的属性组合作为类候选键,将可以快速标识出大部分元组的属性组合作为类候选键,提高了待脱敏处理的属性组合确定的自动化程度,方便对可能侵犯隐私的属性组合进行筛选发布或脱敏处理。

    一种数据污染程度确定方法、装置及存储介质

    公开(公告)号:CN114710301B

    公开(公告)日:2025-01-14

    申请号:CN202011486199.5

    申请日:2020-12-16

    Abstract: 本发明公开了一种数据污染程度确定方法、装置及存储介质,包括:确定网络中各节点的流量;在确定有污染数据时,确定污染时间段内传输过污染数据的节点;根据传输过污染数据的节点在污染时间段内的流量,以及污染数据所占的比例确定数据污染程度。采用本发明,解决了目前没有对数据污染事件导致的污染范围及程度进行评估的方案的问题,实现了对数据污染影响范围及程度的评估,对于节点较多的网络,不需要消耗大量资源常态化计算节点相关属性数据。

Patent Agency Ranking