一种隐私数据的处理方法及装置

    公开(公告)号:CN110929285A

    公开(公告)日:2020-03-27

    申请号:CN201911260166.6

    申请日:2019-12-10

    Inventor: 林博

    Abstract: 本说明书公开了一种隐私数据的处理方法及装置,所述方法包括:对正则表达式进行价值评估计算,以得到所述正则表达式的价值评分;其中,所述正则表达式用于从隐私数据中提取正则特征;所述正则表达式的价值评分,与所述正则表达式包含的信息量正相关;将所述正则表达式与隐私数据集合中的隐私数据进行匹配,并获取所述正则表达式与所述隐私数据集合中的隐私数据匹配成功的次数;根据所述正则表达式的价值评分和所述匹配成功的次数,计算与所述隐私数据集合中的隐私数据对应的正则特征;其中,所述正则特征用于训练机器学习模型。应用本方案,可以令构建得到的正则特征能够更好地刻画隐私数据的特性。

    用于匹配私有数据的匹配模式自动生成方法、装置及设备

    公开(公告)号:CN110929111B

    公开(公告)日:2023-03-31

    申请号:CN201911131750.1

    申请日:2019-11-19

    Inventor: 林博

    Abstract: 本说明书实施例提供一种用于匹配私有数据的匹配模式自动生成方法、装置及设备,在自动生成方法中,确定当前样本分组对应的匹配模式模板。将匹配模式模板中的当前占位符对应的数据位作为当前数据位。基于当前样本分组内的各个样本数据对应于当前数据位的多个字符各自出现的概率,计算当前数据位对应的信息熵。基于信息熵,判断是否需要对当前样本分组进行分裂。若否,则基于多个字符,生成对应于当前数据位的子匹配模式。将当前占位符替换为子匹配模式,得到更新的匹配模式模板。若更新的匹配模式模板不包括占位符,则将其作为第一数据类型对应的最终匹配模式添加到匹配模式列表中。本说明书实施例得到的匹配模式可以用于私有数据的分类模型构建。

    一种密钥检测方法、装置及电子设备

    公开(公告)号:CN111159697B

    公开(公告)日:2022-06-03

    申请号:CN201911402288.4

    申请日:2019-12-27

    Inventor: 林博

    Abstract: 本说明书实施例提供一种密钥检测方法、装置及电子设备。所述方法包括:根据预定的提取规则从文本中提取出一个或多个目标字符串,所述预定的提取规则为根据预定的密钥类型所生成的规则;对所述目标字符串执行检测操作,以便从所述目标字符串中筛选出待确定密钥所对应的字符串;利用预定的搜索方式对文本进行搜索,得到待确定账户标识所对应的字符串;获取与所述待确定密钥以及待确定账户标识分别对应的一个或多个特征数据,并根据所述特征数据将所述待确定密钥与待确定账户标识进行匹配,得到所述待确定密钥的匹配分值,基于所述匹配分值确定与所述密钥类型相对应的密钥,从而实现了密钥的检测。

    一种隐私数据的处理方法及装置

    公开(公告)号:CN110929285B

    公开(公告)日:2022-01-25

    申请号:CN201911260166.6

    申请日:2019-12-10

    Inventor: 林博

    Abstract: 本说明书公开了一种隐私数据的处理方法及装置,所述方法包括:对正则表达式进行价值评估计算,以得到所述正则表达式的价值评分;其中,所述正则表达式用于从隐私数据中提取正则特征;所述正则表达式的价值评分,与所述正则表达式包含的信息量正相关;将所述正则表达式与隐私数据集合中的隐私数据进行匹配,并获取所述正则表达式与所述隐私数据集合中的隐私数据匹配成功的次数;根据所述正则表达式的价值评分和所述匹配成功的次数,计算与所述隐私数据集合中的隐私数据对应的正则特征;其中,所述正则特征用于训练机器学习模型。应用本方案,可以令构建得到的正则特征能够更好地刻画隐私数据的特性。

    数据识别方法和装置
    16.
    发明授权

    公开(公告)号:CN112948646B

    公开(公告)日:2022-12-13

    申请号:CN202110354012.4

    申请日:2021-04-01

    Inventor: 林博

    Abstract: 本说明书实施例提供了一种数据识别方法和装置。根据该实施例的方法,获取待识别数据集;然后从所述待识别数据集中提取各待识别数据的前缀数据;将所述前缀数据与预设类型数据的前缀分布进行匹配,确定所述待识别数据集针对所述预设类型数据的前缀匹配得分;再将所述前缀匹配得分与所述待识别数据集的统计特征输入所述预设类型数据的分类模型,得到所述待识别数据集是否属于所述预设类型数据的分类结果。

    机器学习、隐私代码确定方法、装置及电子设备

    公开(公告)号:CN111143203B

    公开(公告)日:2022-04-22

    申请号:CN201911305402.1

    申请日:2019-12-13

    Inventor: 林博

    Abstract: 本说明书实施例公开了一种机器学习、隐私代码确定方法、装置及电子设备,其中,所述机器学习方法可以获取批量包含正、负样本的样本数据,正样本数据中包含隐私代码文件,负样本数据中不包含隐私代码文件;基于代码文件的相似性度量参数,从所述样本数据中筛选出多个第一代码文件,并从代码文件的隐私标签已知的预设代码库中筛选出多个第二代码文件;基于所述多个第一代码文件和所述多个第二代码文件,确定所述样本数据对应的目标参数;将所述样本数据对应的目标参数及所述样本数据的标签作为输入,训练目标模型,所述目标模型用于确定待检测的一批代码文件与隐私代码文件的相似性度量参数。

Patent Agency Ranking