-
公开(公告)号:CN115495573A
公开(公告)日:2022-12-20
申请号:CN202210935919.4
申请日:2022-08-04
申请人: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
摘要: 本发明公开了一种特定业务类型App的高效准确分类方法,首先构建App社交功能属性体系表,针对不同的功能属性构建关键词过滤规则,通过静态反编译的方式获取功能按钮进行规则匹配,进行细粒度核验,考虑到细粒度核验的速度慢准确率高的特点,将部分细粒度核验的结果人工校验后作为训练数据,以App简介作为输入数据进行深度学习模型训练,实现粗粒度核验,达到快速大批量核验。对核验结果进行人工校对,不断优化整个核验流程。本方法用于App类别判定工作,能够快速、准确地从海量App中筛选出特定业务类型对象。
-
公开(公告)号:CN115292571B
公开(公告)日:2023-03-28
申请号:CN202210942548.2
申请日:2022-08-08
申请人: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/951 , G06F16/215 , G06F8/61 , G06F9/445 , G06F17/18 , G06V10/74 , G06V10/764
摘要: 本发明公开了一种App数据采集方法及系统,所述方法包括对群控平台中所有应用软件进行遍历采集,得到群控平台应用软件信息;对群控平台应用软件中的内容进行深度优先遍历采集,并将获取的内容进行整合;对整合后的采集内容进行判断清洗,获得最终应用软件通用内容。通过采用改进的深度优先遍历算法完成采集工作,保证了采集数据的全面性,同时提高了采集效率。
-
公开(公告)号:CN113343219B
公开(公告)日:2023-03-07
申请号:CN202110606530.0
申请日:2021-05-31
申请人: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
摘要: 本发明公开了一种自动高效的高风险移动应用程序检测方法,包括S1、获取待测App的SDK列表和权限列表,转化为向量形式,得到列表向量;计算待测App与已知的高风险App之间的相似度,判定为潜在风险App;S2、动态分析进一步判定是否为高风险App,若判定为“是”,将其标记为高风险App;S3、人工审核判定是否是高风险App,若“是”,添加至高风险App库,标记为高风险App。本发明采用以静态分析、动态分析为主,辅助以人工审核的方式,避免了人工审核存在的效率低、成本高、准确率低等问题,实现了高风险App得自动高效识别。
-
公开(公告)号:CN113536077A
公开(公告)日:2021-10-22
申请号:CN202110606596.X
申请日:2021-05-31
申请人: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/906 , G06F16/953 , G06F16/901 , G06N20/00
摘要: 本发明公开了一种移动APP特定事件内容检测方法,涉及网络信息安全和自然语言处理交叉技术领域。首先获取互联网上特定事件的若干内容作为原始语料,从中抽取原始关键词;针对原始语料构建关键词关系图,并对关键词关系图进行聚类,得到若干簇;对同一簇中的关键词进行量化和排序,得到最能够表达该事件的特征关键词;将特征关键词输入到APP搜索框中进行自动化检索,保存结果;使用机器学习算法对保存结果进行分析,实现了移动APP中特定事件的自动、高效检测分析。本发明以很低的搜索成本获得了不同移动应用针对特定事件的舆论观点和舆论走向信息。本发明还公开了一种移动APP特定事件内容检测装置。
-
公开(公告)号:CN112073584B
公开(公告)日:2021-05-18
申请号:CN202010941675.1
申请日:2019-08-27
申请人: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
IPC分类号: G06F21/57 , H04M1/72406 , H04M1/72454
摘要: 本发明公开了一种APP收集用户个人敏感信息的风险评估方法,通过对APP进行静态分析以及动态分析,得出权限评分、调用函数评分、SDK评分、流量包参数评分和域名评分,再进行加权求和,得出被评估APP的最终评分,根据评估矩阵得出被评估APP的风险评级;根据风险评级反向维护SDK风险权重库和域名风险权重库,对SDK或域名进行风险权重的修正。本发明的APP收集用户个人敏感信息的风险评估方法包含用户输入的用户个人敏感信息、非用户输入的潜在用户个人敏感信息,对APP收集用户个人敏感信息的风险程度进行量化,更全面的涵盖了多种敏感信息点,细化了APP收集用户个人敏感信息的风险大小,能大批量的评估APP收集用户个人敏感信息的风险程度。
-
公开(公告)号:CN112073584A
公开(公告)日:2020-12-11
申请号:CN202010941675.1
申请日:2019-08-27
申请人: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
摘要: 本发明公开了一种APP收集用户个人敏感信息的风险评估方法,通过对APP进行静态分析以及动态分析,得出权限评分、调用函数评分、SDK评分、流量包参数评分和域名评分,再进行加权求和,得出被评估APP的最终评分,根据评估矩阵得出被评估APP的风险评级;根据风险评级反向维护SDK风险权重库和域名风险权重库,对SDK或域名进行风险权重的修正。本发明的APP收集用户个人敏感信息的风险评估方法包含用户输入的用户个人敏感信息、非用户输入的潜在用户个人敏感信息,对APP收集用户个人敏感信息的风险程度进行量化,更全面的涵盖了多种敏感信息点,细化了APP收集用户个人敏感信息的风险大小,能大批量的评估APP收集用户个人敏感信息的风险程度。
-
公开(公告)号:CN110505348B
公开(公告)日:2020-10-09
申请号:CN201910794491.4
申请日:2019-08-27
申请人: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
摘要: 本发明公开了一种APP收集用户个人敏感信息的风险评估方法,通过对APP进行静态分析以及动态分析,得出权限评分、调用函数评分、SDK评分、流量包参数评分和域名评分,再进行加权求和,得出被评估APP的最终评分,根据评估矩阵得出被评估APP的风险评级;根据风险评级反向维护SDK风险权重库和域名风险权重库,对SDK或域名进行风险权重的修正。本发明的APP收集用户个人敏感信息的风险评估方法包含用户输入的用户个人敏感信息、非用户输入的潜在用户个人敏感信息,对APP收集用户个人敏感信息的风险程度进行量化,更全面的涵盖了多种敏感信息点,细化了APP收集用户个人敏感信息的风险大小,能大批量的评估APP收集用户个人敏感信息的风险程度。
-
公开(公告)号:CN115309899B
公开(公告)日:2023-05-16
申请号:CN202210949186.X
申请日:2022-08-09
申请人: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/35 , G06F18/22 , G06F40/284 , G06N3/0455
摘要: 本发明公开了一种文本中特定内容识别存储方法及系统,属于文特定词识别的技术领域,其方法包括生成特定词库和规则库;获取待识别的文本集合;提取当前特定文本数据集中的新特定词,得到新特定词集合;将需要训练的词组输入BERT模型;从特定文本中获取疑似新特定词集合,利用BERT模型计算特定词库中各词的特征向量与疑似新特定词集合中各词的特征向量的余弦相似度,并基于计算结果判定新特定词。本发明解决了现有技术中基于预构建模式规则的匹配方式仅局限于特定匹配规则模式,匹配方式不够灵活,结果不够全面,难以及时识别海量新出现的特定词及其变体词,且由于文本中涉及大量错综复杂的词语,容易造成特定词的模糊匹配,导致误识别的问题。
-
公开(公告)号:CN113343219A
公开(公告)日:2021-09-03
申请号:CN202110606530.0
申请日:2021-05-31
申请人: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
摘要: 本发明公开了一种自动高效的高风险移动应用程序检测方法,包括S1、获取待测App的SDK列表和权限列表,转化为向量形式,得到列表向量;计算待测App与已知的高风险App之间的相似度,判定为潜在风险App;S2、动态分析进一步判定是否为高风险App,若判定为“是”,将其标记为高风险App;S3、人工审核判定是否是高风险App,若“是”,添加至高风险App库,标记为高风险App。本发明采用以静态分析、动态分析为主,辅助以人工审核的方式,避免了人工审核存在的效率低、成本高、准确率低等问题,实现了高风险App得自动高效识别。
-
公开(公告)号:CN115309899A
公开(公告)日:2022-11-08
申请号:CN202210949186.X
申请日:2022-08-09
申请人: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/35 , G06K9/62 , G06F40/284
摘要: 本发明公开了一种文本中特定内容识别存储方法及系统,属于文特定词识别的技术领域,其方法包括生成特定词库和规则库;获取待识别的文本集合;提取当前特定文本数据集中的新特定词,得到新特定词集合;将需要训练的词组输入BERT模型;从特定文本中获取疑似新特定词集合,利用BERT模型计算特定词库中各词的特征向量与疑似新特定词集合中各词的特征向量的余弦相似度,并基于计算结果判定新特定词。本发明解决了现有技术中基于预构建模式规则的匹配方式仅局限于特定匹配规则模式,匹配方式不够灵活,结果不够全面,难以及时识别海量新出现的特定词及其变体词,且由于文本中涉及大量错综复杂的词语,容易造成特定词的模糊匹配,导致误识别的问题。
-
-
-
-
-
-
-
-
-