-
公开(公告)号:CN112073584A
公开(公告)日:2020-12-11
申请号:CN202010941675.1
申请日:2019-08-27
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种APP收集用户个人敏感信息的风险评估方法,通过对APP进行静态分析以及动态分析,得出权限评分、调用函数评分、SDK评分、流量包参数评分和域名评分,再进行加权求和,得出被评估APP的最终评分,根据评估矩阵得出被评估APP的风险评级;根据风险评级反向维护SDK风险权重库和域名风险权重库,对SDK或域名进行风险权重的修正。本发明的APP收集用户个人敏感信息的风险评估方法包含用户输入的用户个人敏感信息、非用户输入的潜在用户个人敏感信息,对APP收集用户个人敏感信息的风险程度进行量化,更全面的涵盖了多种敏感信息点,细化了APP收集用户个人敏感信息的风险大小,能大批量的评估APP收集用户个人敏感信息的风险程度。
-
公开(公告)号:CN111159990A
公开(公告)日:2020-05-15
申请号:CN201911244936.8
申请日:2019-12-06
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F40/186 , G06F40/126 , G06F40/284 , G06F16/33 , G06F16/31
Abstract: 本发明提出一种基于模式拓展的通用特殊词识别方法及系统,提出了一种基于基础词的音形编码,常用汉字音节,常用汉字结构以及特殊字符映射节点来构建前缀树,通过比较字符编码相似度进行模糊匹配,完成新词提取的方法及系统。本发明可以应用于大量文本中特定词的发现提取,某些任务的数据集的提取生成,给定文本数据集的预处理等场景中,比如短信、微博等数据集的筛选以及纠正等文本预处理过程。本发明为下一步的文本分类任务提供了数据来源和基本标注,也对文本数据中新词的发现和纠正提供了帮助。
-
公开(公告)号:CN111078876A
公开(公告)日:2020-04-28
申请号:CN201911229492.0
申请日:2019-12-04
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F16/35
Abstract: 本发明提出了一种基于多模型集成的短文本分类方法,包括:选取多个对短文本进行分类的分类模型;对训练样本进行采样,生成与该分类模型一一对应的训练集;通过对应的训练集对该分类模型进行训练,以获得对应的最终模型;通过所有该最终模型对目标文本进行分类,获取多个分类结果向量;集成所有该分类结果向量以得到最终结果向量,以该最终结果向量中具有最大值的元素所代表的类别,作为该目标文本的类别。
-
公开(公告)号:CN110061975A
公开(公告)日:2019-07-26
申请号:CN201910249260.5
申请日:2019-03-29
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: H04L29/06
Abstract: 本发明涉及一种基于离线流量包解析的仿冒网站识别方法,包括:根据已知网站信息库训练随机森林分类器,以构建对仿冒网站的判别模型;获取待检测网站的数据流并保存为离线流量包,通过该离线流量包得到该待检测网站的网站信息;根据该已知网站信息库对该网站信息进行规则匹配,对匹配为仿冒网站的待检测网站进行标识,将匹配失败的网站信息通过该判别模型进行判别,并对判别为仿冒网站的待检测网站进行标识。
-
公开(公告)号:CN119759719A
公开(公告)日:2025-04-04
申请号:CN202411830029.2
申请日:2024-12-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F11/34 , G06N3/0475 , G06N3/0455 , G06N3/08 , G06N5/022 , G06N5/04
Abstract: 一种基于提示学习的大模型测评数据生成方法及系统,属于机器学习模型领域,包括以下步骤:从提示模板集合中获取初始提示模板;对初始提示模板进行变异操作;接收输入;将变异后的提示模板和接收的输入相结合组成若干完整提示,将这些完整提示输入到生成模型中得到测评数据;评估测评数据的生成质量,将能生成高质量测评数据的提示模板放入提示模板集合中,供下一次测评数据生成使用。与现有技术相比,本发明具有测评数据生成质量高、测评数据生成成本低、测评数据生成速度快、测评场景丰富、测评数据生成容易实现等优点。
-
公开(公告)号:CN119600625A
公开(公告)日:2025-03-11
申请号:CN202510143447.2
申请日:2025-02-10
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及自然语言处理技术领域,提供一种变体词识别方法及装置,所述方法包括:对待识别文本进行分词,得到至少一个文本分词;对各文本分词进行文本图像生成,得到各文本分词对应的分词图像;基于各文本分词的编码特征,以及对应分词图像的编码特征,得到各文本分词的变体词识别结果。本发明结合各文本分词的编码特征以及对应分词图像的编码特征,可以融合文本语义与视觉细节信息,将文本模态的文本分词和图像模态的分词图像对齐到同一语义空间,更全面地理解和识别变体词,有效提升了变体词识别的准确率。
-
公开(公告)号:CN118277914B
公开(公告)日:2025-01-24
申请号:CN202311471891.4
申请日:2023-11-07
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/2431 , G06F18/24 , G06F18/213 , G06F18/22
Abstract: 本发明涉及APP分类分析技术领域,公开了一种基于动静结合多维度APK特征的移动应用分类方法,首先进行APP特征构建,基于主流手机应用商店、互联网小型分发平台、APP传播页面对APP的信息进行采集,具体通过APP所提供的功能或呈现的信息内容,识别APP的业务分类,采集通信类的信息,形成初始的测试数据集;再基于APP源码进行分析,获取APP的静态源码特征、动态流量和页面特征数据,具体包括名称、流量和内容信息;进行建立规则匹配模型和匹配机制,具体通过构建定时扫描程序,通过预设的各分类规则匹配模型进行识别和研判。本发明对具有显著技术特征或内容特征的APP具有较高的识别准确率,降低人工审核参与度。
-
公开(公告)号:CN114817661B
公开(公告)日:2024-08-13
申请号:CN202210448777.9
申请日:2022-04-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9035 , G06F18/22 , G06F18/23 , G06F18/24
Abstract: 本发明涉及一种基于IP地址画像的大规模IP自动分类方法,本方法首先基于各个IP画像的相似度关系构建图结构,由此确定核心的IP节点,对于新加入的节点,本方法对其进行分类的计算复杂度为O(n),n为核心节点的数量,因此适用于大规模IP数据的线上实时处理。同时,本方法在进行IP分类结果的更新时,会将之前的核心节点与新抽样的节点混合起来重新聚类,这一过程在一定程度上保证了各IP群体的核心稳定性,同时又能较好地反映它们的实时变化。本发明还涉及一种基于IP地址画像的大规模IP自动分类装置和存储介质。
-
公开(公告)号:CN118365673A
公开(公告)日:2024-07-19
申请号:CN202410446799.0
申请日:2024-04-15
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提供一种运动目标检测方法、装置、电子设备和可读存储介质,涉及图像处理和目标检测技术领域,其中,运动目标检测方法,包括:根据多个目标视角下目标场景的图像进行三维立体重建,得到所述目标场景对应的残缺点云,所述目标视角的数量小于视角总数;对所述残缺点云进行点云补全处理,得到所述目标场景对应的完整稀疏点云;对所述完整稀疏点云进行点云稠密化处理,得到所述目标场景对应的完整稠密点云;根据所述完整稠密点云进行运动目标检测,得到所述目标场景中的运动目标。本发明可以提高运动目标检测的准确性。
-
公开(公告)号:CN117768343A
公开(公告)日:2024-03-26
申请号:CN202311587718.0
申请日:2023-11-24
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L43/02 , H04L43/062 , H04L47/70
Abstract: 本发明提供一种针对隧道流量的关联方法和装置,其中所述方法包括:获取预建立的网络隧道的多个入口节点流和多个出口节点流;确定与每个出口节点流对应的候选入口节点流,分别计算多个候选入口节点流的累计传输量距离;将每个出口节点流输入至自编码网络,输出对应的映射入口节点流,分别计算映射入口节点流和多个候选入口节点流的降噪距离;将多个候选入口节点流输入至优化表示生成器,分别输出多个候选入口节点流之间的优化表示距离;根据多个候选入口节点流的累计传输量距离、和映射入口节点流的降噪距离以及多个候选入口节点流之间的优化表示距离,对候选入口节点流进行筛选,确定每个出口节点流对应的目标入口节点流。
-
-
-
-
-
-
-
-
-