-
公开(公告)号:CN113283232A
公开(公告)日:2021-08-20
申请号:CN202110601345.2
申请日:2021-05-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/205 , G06F40/211 , G06F40/289 , G06F21/62 , G06N3/04 , G06K9/62 , G06N3/08
Abstract: 本说明书实施例提供一种自动解析文本中隐私信息的方法和装置,方法包括:获取待解析文本;对所述待解析文本进行分词处理,得到包含若干个词语的词序列;对所述词序列进行基于上下文的编码,得到所述若干个词语分别对应的词向量;根据所述词向量,确定其对应的词语分别属于多个隐私信息类别的各概率;将所述各概率中最大概率对应的隐私信息类别确定为相应词语的归属类别;根据词语的归属类别和该词语在所述词序列中的位置,确定所述待解析文本的解析结果。能够提升文本的解析效果。
-
公开(公告)号:CN113220949A
公开(公告)日:2021-08-06
申请号:CN202110517500.2
申请日:2021-05-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/903 , G06F16/906 , G06F40/295 , G06F21/62
Abstract: 本说明书公开了一种隐私数据识别系统的构建方法及装置。该方法应用于隐私识别服务平台,隐私识别服务平台配置有多个隐私识别模块集合,不同的隐私识别模块集合具有不同的识别性能;各识别模块集合整体能够识别的隐私数据类型相同、任意识别模块集合内的不同模块分别用于识别不同类型的隐私数据;所述方法包括:接收目标需求方发送的识别系统构建请求;请求中包括:对隐私数据类型的识别需求、以及对识别性能的需求;从多个隐私识别模块集合中,选择与识别性能需求相匹配的模块集合;在所选择的模块集合中,选择与隐私数据类型的识别需求相匹配的一个或多个识别模块;基于所选择的模块,构建对应于目标需求方的隐私数据识别系统。
-
公开(公告)号:CN112257114A
公开(公告)日:2021-01-22
申请号:CN202011390190.4
申请日:2020-12-02
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种应用程序的隐私合规检测方法、装置、设备和计算机可读介质。方案可以包括:使用多标签分类模型从待识别应用程序的隐私声明文本中识别出隐私声明文本声明采集的第一隐私数据类型集合,并确定待识别应用程序的源码中表示的所述待识别应用程序采集的第二隐私数据类型集合,以及获取待识别应用程序被允许采集的标准隐私数据类型集合,然后将所述第一隐私数据类型集合、所述第二隐私数据类型集合和所述标准隐私数据类型集合三者进行对比分析,可以自动获得APP的隐私合规性检测结果。
-
公开(公告)号:CN111783126A
公开(公告)日:2020-10-16
申请号:CN202010706285.6
申请日:2020-07-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/60 , G06F21/62 , G06F16/903 , G06K9/62
Abstract: 本说明书实施例公开了一种隐私数据识别方法、装置、设备和可读介质。方案包括:获取第一数据集的第一长度分布向量和第一字符分布统计信息,所述第一数据集为隐私数据样本的集合;获取第二数据集的第二长度分布向量和第二字符分布统计信息,所述第二数据集为待识别字段对应的至少部分数据样本的集合;计算所述第一数据集与所述第二数据集的长度分布相似度、字符分布相似度,并基于所述长度分布相似度和字符分布相似度确定所述待识别字段对应的数据是否为与所述第一数据集同类型的隐私数据。
-
公开(公告)号:CN111061763A
公开(公告)日:2020-04-24
申请号:CN201911109250.8
申请日:2019-11-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/2455
Abstract: 本说明书的实施例提供用于生成规则引擎的规则执行计划的方法及装置。在该方法中,基于规则树中的逻辑运算关系,对规则树进行层次分析,以得到规则树的分层结构信息,所述分层结构信息包括每层分层结构的逻辑组成关系以及各层分层结构的层级关系;确定各个规则单元的执行开销;基于各个规则单元的执行开销以及规则树的分层结构信息,确定各个规则单元的执行顺序;以及根据所确定出的各个规则单元的执行顺序,生成规则的规则执行计划。
-
-
-
-