-
公开(公告)号:CN115687798A
公开(公告)日:2023-02-03
申请号:CN202211412608.6
申请日:2022-11-11
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心 , 国家计算机网络与信息安全管理中心上海分中心
IPC: G06F16/9536 , G06F16/901 , G06Q50/00
Abstract: 一种基于特定话题下的社交网络数据获取方法,涉及网络信息采集领域,本发明针对现有的社交网络获取方法采集结果不准确、效率低、获取数据不完整、考虑维度不全面的缺陷,提供了一种社交网络数据获取方法:对目标用户在特定话题下的社交关系进行关联分析,获得社交网络数据;构建并合成社交网络全信息无向图;获得目标用户发布社交信息的总次数和相邻两用户进行社交行为的总次数;预设不同社交行为的权重,计算两个用户之间的社交关联度;获得关联用户的影响力,采集关联用户针对特定话题的社交网络数据,并统计追踪热度;当采集的总数据量达到预设数量时,停止采集。用于获取特定话题下的社交网络数据。
-
公开(公告)号:CN117609804A
公开(公告)日:2024-02-27
申请号:CN202311255685.X
申请日:2023-09-26
Applicant: 国家计算机网络与信息安全管理中心 , 国家计算机网络与信息安全管理中心上海分中心
Abstract: 本发明公开了一种基于先验聚类及多语图谱推理的用户分析方法及系统,所述方法包括:将平台重点用户标记为目标用户和非目标用户;提取平台中每个用户的特征,构建重点用户样本分布矩阵B及除重点用户外的其他用户的待聚类用户样本分布矩阵A;将所述目标用户分为K1个类别,确定矩阵A中的样本点初始重心数K2,将其他用户分为K1+K2个聚类簇;将每个样本对应的其他用户标记为目标用户或非目标用户;构建一个包含目标内容、非目标内容的多语知识图谱;对目标用户、非目标用户在平台中的聚焦点进行推理。本方法仅依据平台积累的用户行为先验知识及平台积累的用户相关内容信息即可构造一套用户分析方法与系统。
-
公开(公告)号:CN113034331A
公开(公告)日:2021-06-25
申请号:CN202110490157.7
申请日:2021-05-06
Applicant: 国家计算机网络与信息安全管理中心上海分中心
IPC: G06Q50/34 , G06F16/951 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于多模态融合的安卓赌博应用识别方法和系统,属于安卓应用安全技术领域,该识别方法具体过程如下;(1)批量获取网站评论和赌博网站中安卓赌博应用下载线索信息;(2)通过在目标网站发现以APK结尾的应用下载链接,提取疑似安卓应用;(3)提取安卓应用安装包的包名、图标、证书、IP地址、URL域名和电子邮件地址;(4)通过多模态融合的安卓赌博应用识别模型,判定识别赌博应用包括图像模型、文本模型和Multihead Attention融合模型;(5)存储发现的安卓应用基本信息及应用安装包;本发明多模态识别模型能够精确地识别出安卓平台中的赌博应用,有利于减少网络赌博违法犯罪活动。
-
公开(公告)号:CN116306613A
公开(公告)日:2023-06-23
申请号:CN202211531946.1
申请日:2022-12-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/284 , G06F40/211 , G06F21/62 , G06F18/214 , G06N3/0442 , G06N3/0895
Abstract: 本发明公开了一种基于半监督学习的DHT网络敏感内容识别方法,通过爬取DHT网络得到网络数据并对其中部分数据进行人工标注,构建了文件元数据数据集,同时针对种子信息文本自身具有的有效信息较为分散等特征,采用基于注意力机制的双向长短期记忆网络模型进行敏感内容识别,运用基于数据驱动的学习型算法极大减少了人工干预定义规则的需求,同时针对DHT网络数据训练过程中存在的数据量少、数据不平衡及无效样本多等问题,采用基于有标签数据和无标签数据同时进行训练的半监督学习方法有效提升了模型在小样本标注数据集上的训练效果。
-
公开(公告)号:CN116260739A
公开(公告)日:2023-06-13
申请号:CN202211531948.0
申请日:2022-12-01
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种BitTorrent网络敏感信息传播监测方法,基于DHT信息动态感知根据DHT网络节点相邻原理和资源寻址算法构造模拟节点,将模拟节点加入DHT网络使其进入出现敏感行为的DHT网络节点路由表中感知敏感信息的交互,并在网络中出现新的敏感节点时基于现有模拟节点构造新增模拟节点实现对新的敏感节点的监测,由此基于模拟节点的生成机制实现了DHT网络中涉及敏感信息传播行为的节点的高效发现。
-
公开(公告)号:CN114330307A
公开(公告)日:2022-04-12
申请号:CN202110483554.1
申请日:2021-04-30
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/242 , G06F40/284 , G06F40/295
Abstract: 本发明公开了一种基于限定领域的分词方法及系统,方法包括:对限定领域的数据进行预处理,对预处理后得到的数据中的命名实体进行识别,并抽取出数据中的实体词汇,得到命名实体识别结果;基于预处理后得到的数据计算限定领域语料中的特征信息,并根据得到的特征信息构建新词发现模型,利用新词发现模型对语料库中的新词进行识别,以获取新词数据组;利用所述命名实体识别结果及常用词词典对获取的新词数据组进行过滤,排除掉常用词汇和实体词汇,以获取并确认敏感词,并基于确认后的敏感词建立敏感词库;结合敏感词库中获取的敏感词信息和命名实体识别结果进行分词。解决了现有技术中在限定领域中分词准确性较差的技术问题。
-
公开(公告)号:CN116244494A
公开(公告)日:2023-06-09
申请号:CN202211531943.8
申请日:2022-12-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , H04L61/4511 , G06F16/9538 , G06F16/951 , G06F16/955 , G06F18/214 , G06F18/2411
Abstract: 本发明公开了一种特定类型磁力搜索网站发现检测方法,基于获取的网站静态特征对网站进行分类得到磁力搜索网站和磁力导航网站,再通过自动化测试工具分析网站搜索返回结果等动态特征,采用动态分析的方式有效解决了基于静态特征无法区分有害和无害磁力搜索网站的问题,能够精准检测发现特定类型磁力搜索网站,同时还扩大了网站分类样本和网站违法违规样本,达到更为精准发现检测特定类型磁力搜索网站的目标。
-
-
-
-
-
-