一种App收集用户个人敏感信息的风险评估方法

    公开(公告)号:CN112073584A

    公开(公告)日:2020-12-11

    申请号:CN202010941675.1

    申请日:2019-08-27

    IPC分类号: H04M1/725 G06F21/57

    摘要: 本发明公开了一种APP收集用户个人敏感信息的风险评估方法,通过对APP进行静态分析以及动态分析,得出权限评分、调用函数评分、SDK评分、流量包参数评分和域名评分,再进行加权求和,得出被评估APP的最终评分,根据评估矩阵得出被评估APP的风险评级;根据风险评级反向维护SDK风险权重库和域名风险权重库,对SDK或域名进行风险权重的修正。本发明的APP收集用户个人敏感信息的风险评估方法包含用户输入的用户个人敏感信息、非用户输入的潜在用户个人敏感信息,对APP收集用户个人敏感信息的风险程度进行量化,更全面的涵盖了多种敏感信息点,细化了APP收集用户个人敏感信息的风险大小,能大批量的评估APP收集用户个人敏感信息的风险程度。

    基于逐点互信息技术的诈骗信息特征词提取方法及系统

    公开(公告)号:CN107992473B

    公开(公告)日:2021-04-27

    申请号:CN201711190871.4

    申请日:2017-11-24

    IPC分类号: G06F40/289 G06F16/35

    摘要: 本发明涉及一种基于逐点互信息技术的诈骗信息特征词提取方法及系统,该提取方法包括:提取诈骗信息主题关键词,组成主题关键词集合;将信息组中的信息按是否为诈骗信息划分为正样本集合和负样本集合,并得到正样本分词集合、负样本候分词集合和候选关键词集合;根据候选关键词集合的候选关键词在信息组的正相互性PMI值和负相互性PMI值得到候选关键词在信息组的权重,将权重大于预设阈值的候选关键词记为信息组的合格关键词。本发明通过对信息组中的信息进行处理,得到候选关键词集合,计算候选关键词相对于信息的正相互性PMI值和负相互性PMI值,得到候选关键词的权重,由此判断是否为合格关键词,实现了对数据流式信息的关键词提取。

    一种基于不平衡多源数据的情感分类方法及系统

    公开(公告)号:CN110134947B

    公开(公告)日:2021-03-26

    申请号:CN201910307654.1

    申请日:2019-04-17

    IPC分类号: G06F40/30 G06N3/08

    摘要: 本发明提出一种基于不平衡多源数据的情感分类方法,包括:获取来自多个数据源的训练数据,其中训练数据包含多条文本数据,每条文本数据具有情感类型标签和其对应的数据源;按数据源对训练数据进行分类,以集合每个数据源对应的文本数据作为第一数据集,根据每个第一数据集中各情感类型标签的数量,统计每个第一数据集中情感类型的标准差,选择标准差最小的第一数据作为预训练集,其余第一数据集作为后续训练集;以预训练集训练神经网络模型的权值直到损失函数收敛,输出神经网络模型作为预分类模型,以后续训练集继续训练预分类模型直到损失函数收敛,输出预分类模型作为最终分类模型;将待情感分类文本数据输入最终分类模型,得到其情感类型。

    基于逐点互信息技术的诈骗信息特征词提取方法及系统

    公开(公告)号:CN107992473A

    公开(公告)日:2018-05-04

    申请号:CN201711190871.4

    申请日:2017-11-24

    IPC分类号: G06F17/27 G06F17/30

    摘要: 本发明涉及一种基于逐点互信息技术的诈骗信息特征词提取方法及系统,该提取方法包括:提取诈骗信息主题关键词,组成主题关键词集合;将信息组中的信息按是否为诈骗信息划分为正样本集合和负样本集合,并得到正样本分词集合、负样本候分词集合和候选关键词集合;根据候选关键词集合的候选关键词在信息组的正相互性PMI值和负相互性PMI值得到候选关键词在信息组的权重,将权重大于预设阈值的候选关键词记为信息组的合格关键词。本发明通过对信息组中的信息进行处理,得到候选关键词集合,计算候选关键词相对于信息的正相互性PMI值和负相互性PMI值,得到候选关键词的权重,由此判断是否为合格关键词,实现了对数据流式信息的关键词提取。