-
公开(公告)号:CN117874755B
公开(公告)日:2024-05-10
申请号:CN202410281993.8
申请日:2024-03-13
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F21/55 , G06N5/022 , G06F16/36 , G06F40/117 , G06F40/166 , G06F40/279 , G06F16/901
Abstract: 本发明公开了一种识别暗网威胁用户的系统及方法,涉及威胁用户识别领域;其构建了暗网知识图谱,补全用户人物属性与关联属性;使用语言模型,对用户关联的文本内容进行处理与标签标记,补全用户关联的标签特征;协同知识图谱与语言模型,将暗网用户的属性特征、暗网用户的三度关联关系特征、关联实体的扩展属性特征嵌入到语言模型中,实现对暗网威胁用户的准确识别;最后,使用可视化界面对暗网威胁用户进行预警与推送,并展现该用户的三度关系,为决策者提供判断依据;本发明,实现了对暗网威胁用户的准确识别。
-
公开(公告)号:CN117874755A
公开(公告)日:2024-04-12
申请号:CN202410281993.8
申请日:2024-03-13
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F21/55 , G06N5/022 , G06F16/36 , G06F40/117 , G06F40/166 , G06F40/279 , G06F16/901
Abstract: 本发明公开了一种识别暗网威胁用户的系统及方法,涉及威胁用户识别领域;其构建了暗网知识图谱,补全用户人物属性与关联属性;使用语言模型,对用户关联的文本内容进行处理与标签标记,补全用户关联的标签特征;协同知识图谱与语言模型,将暗网用户的属性特征、暗网用户的三度关联关系特征、关联实体的扩展属性特征嵌入到语言模型中,实现对暗网威胁用户的准确识别;最后,使用可视化界面对暗网威胁用户进行预警与推送,并展现该用户的三度关系,为决策者提供判断依据;本发明,实现了对暗网威胁用户的准确识别。
-
公开(公告)号:CN114124468B
公开(公告)日:2023-06-09
申请号:CN202111271756.6
申请日:2021-10-29
Applicant: 中国电子科技集团公司第三十研究所
IPC: H04L9/40 , G06F18/2431 , G06N3/0464 , G06N3/08 , G06N20/00
Abstract: 本发明公开了一种基于多协议联合分析的I2P通信流量检测方法及装置,其中检测方法包括:流量原始数据预处理:对PCAP格式的文件进行预处理,包括过滤其他流量,所述其他流量包括ICMP、ARP和DHCP流量;数据处理及深度学习算法识别:利用卷积神经网络CNN对TCP协议传输的加密流量进行训练;统计类特征提取与机器学习算法识别:提取同一会话的上下文流量中UDP流量与TCP流量的相关统计特征,并利用梯度提升树GBDT进行训练;模型融合:将深度学习与机器学习的输出进行融合,并输出最后的预测结果。本发明结合TCP协议与UDP协议会话,提取相关特征,融合机器学习与机器学习,可有效提高I2P流量检测的准确性。
-
公开(公告)号:CN115001987B
公开(公告)日:2022-12-09
申请号:CN202210845586.6
申请日:2022-07-19
Applicant: 中国电子科技集团公司第三十研究所
IPC: H04L41/14 , H04L9/08 , H04L9/32 , H04L61/4511
Abstract: 本发明涉及计算机网络技术领域,公开了一种Tor网络的域名规模评估方法及系统,该评估方法,利用描述符中的盲密钥与Tor V3的域名绑定关系对全网隐藏服务进行域名规模评估。本发明解决了现有技术存在的无法实现V3版本域名规模估计的问题。
-
公开(公告)号:CN114168860A
公开(公告)日:2022-03-11
申请号:CN202111366898.0
申请日:2021-11-18
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F16/9536 , G06F16/35
Abstract: 本发明提供一种基于网络特征的暗网站点用户关联方法及装置,所述方法包括如下步骤:S10,采用pattern匹配提取暗网中的网络特征;S20,根据提取的网络特征通过聚类实现暗网用户关联。本发明通过网络特征提取以及基于网络特征聚类的用户关联,可精准识别具备关联关系的暗网用户,并且关联方式简单,关联准确率高。从而能够可有效发现暗网中的关联信息,为暗网数据追踪溯源、暗网数据监控、暗网数据治理提供有力的技术支撑。
-
公开(公告)号:CN114124463A
公开(公告)日:2022-03-01
申请号:CN202111253442.3
申请日:2021-10-27
Applicant: 中国电子科技集团公司第三十研究所
IPC: H04L9/40 , H04L41/16 , H04L61/4511 , H04L67/02
Abstract: 本发明提供了基于网络行为特征的暗网加密应用服务识别方法及系统,包括:步骤1、采集历史一段时间内明网与暗网的应用流量数据,并根据五元组信息标注出对应的应用服务,作为训练集;步骤2、以应用流量数据的五元组作为关键值对会话进行解析,提取会话特征;步骤3、提取源IP及目的地址对应的行为特征,构建IP行为特征;步骤4、按相同的源IP地址,将IP行为特征拼接到会话特征中,形成网络行为特征集;步骤5、根据网络行为特征集与训练集进行预测模型进行训练,完成训练后,通过预测模型对未知的网络行为特征样本进行应用服务识别。本发明提出的方案能够提高暗网加密应用服务检测的准确性以及能较全面与完善的提取流量特征。
-
公开(公告)号:CN114090901A
公开(公告)日:2022-02-25
申请号:CN202111367617.3
申请日:2021-11-18
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F16/9536 , G06F16/35 , G06K9/62 , G06Q30/06
Abstract: 本发明提供一种基于多模融合特征的暗网相似商品判定方法、存储介质及计算装置,所述方法包括:步骤10,采集暗网商品数据并对商品分类;其中,采集的暗网商品数据包括商品文字和商品图片,并对采集的商品图片生成md5值;步骤20,基于步骤1中采集的暗网商品数据以及商品分类结果,计算商品图片的感知哈希指纹值以及商品文字的Word2Vec句向量值;步骤30,基于商品图片的md5值、商品图片的感知哈希指纹值以及商品文字的Word2Vec句向量值,对商品相似度进行计算。本发明通过构建一种融合商品图片和商品文本的相似度计算方法,能够解决暗网商品图片模糊,文字信息简单,相似商品的判定存在困难的问题。
-
公开(公告)号:CN114090796A
公开(公告)日:2022-02-25
申请号:CN202111367064.1
申请日:2021-11-18
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F16/38 , G06F16/35 , G06F16/36 , G06F40/284
Abstract: 本发明提供一种多平台文本二级标签体系搭建及完善迭代的方法,包括:S10,迭代扩充一级标签下的代表词;S20,基于代表词确定初始二级标签;S30,基于初始二级标签完成二级标签扩充与融合。本发明的有益效果是:1、本发明通过代表词语料获取,词向量模型训练,相似词提取的方式扩充代表词数量,极大地减少了人工收集的过程,并且也较大的降低了人工筛选的难度。2、本发明利用代表词聚类的方式自动化生成各代表词的标签类别,对于人工归纳二级标签提供了便利型。3、本发明使用测试文本进行二级标签的进一步扩充融合的方法除了提高了二级标签的覆盖率,对于新文本二级标签的归类和新建也提供了帮助。
-
公开(公告)号:CN114090772A
公开(公告)日:2022-02-25
申请号:CN202111237872.6
申请日:2021-10-25
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F16/35 , G06F16/955 , G06K9/62 , G06Q30/06
Abstract: 本发明提供了一种基于文本分类和信息抽取的暗网商品标注方法及系统,构建暗网商品分类体系,对商品进行分类,得到商品的分类标签;提取暗网商品描述文本中的关键信息获取信息标签;融合分类标签与信息标签对商品进行标注。本发明提出的方案结合文本分类和信息抽取技术构建一套暗网商品分类体系,包含封闭的一二级类别和开放的三级类别;可实现暗网商品的多维度标注,在保证覆盖粗粒度和细粒度标签的同时达到较高的准确率;有监督模型训练样本构建过程中只需标注一二级类别,信息抽取模型无需构建训练样本,降低人工标注所需的人力成本。
-
公开(公告)号:CN113792202A
公开(公告)日:2021-12-14
申请号:CN202111015189.8
申请日:2021-08-31
Applicant: 中国电子科技集团公司第三十研究所 , 深圳市网联安瑞网络科技有限公司
IPC: G06F16/906 , G06F16/26
Abstract: 本发明提供一种用户分类的筛选方法,包括用户历史数据的处理步骤和用户新增数据的处理步骤;用户历史数据的处理步骤包括:获取用户历史数据;根据预设的分类规则引擎对用户历史数据组成的样本集群按照关键进行分类得到多个样本类群;用户新增数据的处理步骤包括:对每个样本类群的用户历史数据进行量化,得到每一个样本类群的类群特征信息,将每个样本类群的关键词和类群特征信息作为结构化数据;获取用户新增数据并提取用户新增数据的结构化数据,通过将用户新增数据的结构化数据与分类规则引擎中每一个样本类群的结构化数据进行匹配进行分类。本发明通过设置分类规则引擎有效合理地将全量用户进行分类,用户信息管理更加清晰高效,且使用方便。
-
-
-
-
-
-
-
-
-