-
公开(公告)号:CN117609804A
公开(公告)日:2024-02-27
申请号:CN202311255685.X
申请日:2023-09-26
Applicant: 国家计算机网络与信息安全管理中心 , 国家计算机网络与信息安全管理中心上海分中心
Abstract: 本发明公开了一种基于先验聚类及多语图谱推理的用户分析方法及系统,所述方法包括:将平台重点用户标记为目标用户和非目标用户;提取平台中每个用户的特征,构建重点用户样本分布矩阵B及除重点用户外的其他用户的待聚类用户样本分布矩阵A;将所述目标用户分为K1个类别,确定矩阵A中的样本点初始重心数K2,将其他用户分为K1+K2个聚类簇;将每个样本对应的其他用户标记为目标用户或非目标用户;构建一个包含目标内容、非目标内容的多语知识图谱;对目标用户、非目标用户在平台中的聚焦点进行推理。本方法仅依据平台积累的用户行为先验知识及平台积累的用户相关内容信息即可构造一套用户分析方法与系统。
-
公开(公告)号:CN115713462A
公开(公告)日:2023-02-24
申请号:CN202211412609.0
申请日:2022-11-11
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心 , 国家计算机网络与信息安全管理中心上海分中心
IPC: G06T3/40 , G06N3/0464 , G06N3/08 , G06N3/082
Abstract: 本发明公开了超分辨模型训练方法、图像识别方法、装置及设备,属于图像处理技术领域,获取多个样本数据,样本数据包括获取同一场景成对的 ;构建图像超分辨率模型:将含有多个卷积网络模块的深度神经网络模型分别对低分辨率图像和高分辨率图像的特征进行提取和映射,学习特征间非线性的映射关系,最终将提取到的特征进行加权融合;构建目标方程:将低分辨率图像LR(x)输入到图像超分辨率模型中,获得超分辨率图像SR(x),SR(x)与对应的高分辨率图像HR(x)计算损失用于约束网络的训练过程。本申请能够使得重建后的高分辨率图像具有更清晰的纹理细节,进而提高图像检测的精确率。
-
公开(公告)号:CN113034331A
公开(公告)日:2021-06-25
申请号:CN202110490157.7
申请日:2021-05-06
Applicant: 国家计算机网络与信息安全管理中心上海分中心
IPC: G06Q50/34 , G06F16/951 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于多模态融合的安卓赌博应用识别方法和系统,属于安卓应用安全技术领域,该识别方法具体过程如下;(1)批量获取网站评论和赌博网站中安卓赌博应用下载线索信息;(2)通过在目标网站发现以APK结尾的应用下载链接,提取疑似安卓应用;(3)提取安卓应用安装包的包名、图标、证书、IP地址、URL域名和电子邮件地址;(4)通过多模态融合的安卓赌博应用识别模型,判定识别赌博应用包括图像模型、文本模型和Multihead Attention融合模型;(5)存储发现的安卓应用基本信息及应用安装包;本发明多模态识别模型能够精确地识别出安卓平台中的赌博应用,有利于减少网络赌博违法犯罪活动。
-
公开(公告)号:CN116244494A
公开(公告)日:2023-06-09
申请号:CN202211531943.8
申请日:2022-12-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , H04L61/4511 , G06F16/9538 , G06F16/951 , G06F16/955 , G06F18/214 , G06F18/2411
Abstract: 本发明公开了一种特定类型磁力搜索网站发现检测方法,基于获取的网站静态特征对网站进行分类得到磁力搜索网站和磁力导航网站,再通过自动化测试工具分析网站搜索返回结果等动态特征,采用动态分析的方式有效解决了基于静态特征无法区分有害和无害磁力搜索网站的问题,能够精准检测发现特定类型磁力搜索网站,同时还扩大了网站分类样本和网站违法违规样本,达到更为精准发现检测特定类型磁力搜索网站的目标。
-
公开(公告)号:CN116306613A
公开(公告)日:2023-06-23
申请号:CN202211531946.1
申请日:2022-12-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/284 , G06F40/211 , G06F21/62 , G06F18/214 , G06N3/0442 , G06N3/0895
Abstract: 本发明公开了一种基于半监督学习的DHT网络敏感内容识别方法,通过爬取DHT网络得到网络数据并对其中部分数据进行人工标注,构建了文件元数据数据集,同时针对种子信息文本自身具有的有效信息较为分散等特征,采用基于注意力机制的双向长短期记忆网络模型进行敏感内容识别,运用基于数据驱动的学习型算法极大减少了人工干预定义规则的需求,同时针对DHT网络数据训练过程中存在的数据量少、数据不平衡及无效样本多等问题,采用基于有标签数据和无标签数据同时进行训练的半监督学习方法有效提升了模型在小样本标注数据集上的训练效果。
-
公开(公告)号:CN116260739A
公开(公告)日:2023-06-13
申请号:CN202211531948.0
申请日:2022-12-01
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种BitTorrent网络敏感信息传播监测方法,基于DHT信息动态感知根据DHT网络节点相邻原理和资源寻址算法构造模拟节点,将模拟节点加入DHT网络使其进入出现敏感行为的DHT网络节点路由表中感知敏感信息的交互,并在网络中出现新的敏感节点时基于现有模拟节点构造新增模拟节点实现对新的敏感节点的监测,由此基于模拟节点的生成机制实现了DHT网络中涉及敏感信息传播行为的节点的高效发现。
-
公开(公告)号:CN114330307A
公开(公告)日:2022-04-12
申请号:CN202110483554.1
申请日:2021-04-30
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/242 , G06F40/284 , G06F40/295
Abstract: 本发明公开了一种基于限定领域的分词方法及系统,方法包括:对限定领域的数据进行预处理,对预处理后得到的数据中的命名实体进行识别,并抽取出数据中的实体词汇,得到命名实体识别结果;基于预处理后得到的数据计算限定领域语料中的特征信息,并根据得到的特征信息构建新词发现模型,利用新词发现模型对语料库中的新词进行识别,以获取新词数据组;利用所述命名实体识别结果及常用词词典对获取的新词数据组进行过滤,排除掉常用词汇和实体词汇,以获取并确认敏感词,并基于确认后的敏感词建立敏感词库;结合敏感词库中获取的敏感词信息和命名实体识别结果进行分词。解决了现有技术中在限定领域中分词准确性较差的技术问题。
-
-
-
-
-
-