一种基于网络特征的暗网站点用户关联方法及装置

    公开(公告)号:CN114168860A

    公开(公告)日:2022-03-11

    申请号:CN202111366898.0

    申请日:2021-11-18

    Abstract: 本发明提供一种基于网络特征的暗网站点用户关联方法及装置,所述方法包括如下步骤:S10,采用pattern匹配提取暗网中的网络特征;S20,根据提取的网络特征通过聚类实现暗网用户关联。本发明通过网络特征提取以及基于网络特征聚类的用户关联,可精准识别具备关联关系的暗网用户,并且关联方式简单,关联准确率高。从而能够可有效发现暗网中的关联信息,为暗网数据追踪溯源、暗网数据监控、暗网数据治理提供有力的技术支撑。

    基于网络行为特征的暗网加密应用服务识别方法及系统

    公开(公告)号:CN114124463A

    公开(公告)日:2022-03-01

    申请号:CN202111253442.3

    申请日:2021-10-27

    Abstract: 本发明提供了基于网络行为特征的暗网加密应用服务识别方法及系统,包括:步骤1、采集历史一段时间内明网与暗网的应用流量数据,并根据五元组信息标注出对应的应用服务,作为训练集;步骤2、以应用流量数据的五元组作为关键值对会话进行解析,提取会话特征;步骤3、提取源IP及目的地址对应的行为特征,构建IP行为特征;步骤4、按相同的源IP地址,将IP行为特征拼接到会话特征中,形成网络行为特征集;步骤5、根据网络行为特征集与训练集进行预测模型进行训练,完成训练后,通过预测模型对未知的网络行为特征样本进行应用服务识别。本发明提出的方案能够提高暗网加密应用服务检测的准确性以及能较全面与完善的提取流量特征。

    一种基于多模融合特征的暗网相似商品判定方法、存储介质及计算装置

    公开(公告)号:CN114090901A

    公开(公告)日:2022-02-25

    申请号:CN202111367617.3

    申请日:2021-11-18

    Abstract: 本发明提供一种基于多模融合特征的暗网相似商品判定方法、存储介质及计算装置,所述方法包括:步骤10,采集暗网商品数据并对商品分类;其中,采集的暗网商品数据包括商品文字和商品图片,并对采集的商品图片生成md5值;步骤20,基于步骤1中采集的暗网商品数据以及商品分类结果,计算商品图片的感知哈希指纹值以及商品文字的Word2Vec句向量值;步骤30,基于商品图片的md5值、商品图片的感知哈希指纹值以及商品文字的Word2Vec句向量值,对商品相似度进行计算。本发明通过构建一种融合商品图片和商品文本的相似度计算方法,能够解决暗网商品图片模糊,文字信息简单,相似商品的判定存在困难的问题。

    一种基于文本分类和信息抽取的暗网商品标注方法及系统

    公开(公告)号:CN114090772A

    公开(公告)日:2022-02-25

    申请号:CN202111237872.6

    申请日:2021-10-25

    Abstract: 本发明提供了一种基于文本分类和信息抽取的暗网商品标注方法及系统,构建暗网商品分类体系,对商品进行分类,得到商品的分类标签;提取暗网商品描述文本中的关键信息获取信息标签;融合分类标签与信息标签对商品进行标注。本发明提出的方案结合文本分类和信息抽取技术构建一套暗网商品分类体系,包含封闭的一二级类别和开放的三级类别;可实现暗网商品的多维度标注,在保证覆盖粗粒度和细粒度标签的同时达到较高的准确率;有监督模型训练样本构建过程中只需标注一二级类别,信息抽取模型无需构建训练样本,降低人工标注所需的人力成本。

    一种用户分类的筛选方法
    76.
    发明公开

    公开(公告)号:CN113792202A

    公开(公告)日:2021-12-14

    申请号:CN202111015189.8

    申请日:2021-08-31

    Abstract: 本发明提供一种用户分类的筛选方法,包括用户历史数据的处理步骤和用户新增数据的处理步骤;用户历史数据的处理步骤包括:获取用户历史数据;根据预设的分类规则引擎对用户历史数据组成的样本集群按照关键进行分类得到多个样本类群;用户新增数据的处理步骤包括:对每个样本类群的用户历史数据进行量化,得到每一个样本类群的类群特征信息,将每个样本类群的关键词和类群特征信息作为结构化数据;获取用户新增数据并提取用户新增数据的结构化数据,通过将用户新增数据的结构化数据与分类规则引擎中每一个样本类群的结构化数据进行匹配进行分类。本发明通过设置分类规则引擎有效合理地将全量用户进行分类,用户信息管理更加清晰高效,且使用方便。

    一种面向示意图的对象检测方法

    公开(公告)号:CN113657415A

    公开(公告)日:2021-11-16

    申请号:CN202111224290.4

    申请日:2021-10-21

    Abstract: 本发明公开了一种面向示意图的对象检测方法,属于数据识别技术领域,包括:根据示意图生成若干个超像素区域,依据超像素区域中聚类中心点构造度量标准并更新聚类中心点;超像素划分为块矩形并经最大值池化处理,得到的特征图并根据其得到编码信息;随机选聚类中心点,利用编码信息、位置信息与聚类中心点的相似度得到编码信息和位置信息形成的聚类簇;将同一聚类簇的编码信息和位置信息分别进行融合形成大超像素块的特征信息和位置信息;将同一聚类簇的大超像素块的位置信息进行排序;将待检测对象周围不必要的位置信息进行去除,保留最符合真实数据的位置信息;完成示意图的对象检测。本发明对示意图的识别更加准确。

    一种基于漏洞组合的攻击链构建方法

    公开(公告)号:CN113591092A

    公开(公告)日:2021-11-02

    申请号:CN202110691074.4

    申请日:2021-06-22

    Abstract: 本发明提供一种基于漏洞组合的攻击链构建方法,包括如下步骤:步骤10,获取靶系统上的漏洞信息,并基于所述漏洞信息得到漏洞列表、漏洞组合序列和漏洞参数集;步骤20,基于所述漏洞列表和漏洞组合序列进行处理得到攻击链序列;步骤30,基于所述漏洞参数集进行处理得到漏洞权重集;步骤40,基于所述漏洞权重集和攻击链序列进行处理得到攻击链权重集;步骤50,从所述攻击链权重集中筛选出权重值最大的一条攻击链。本发明通过结合现有的漏洞组合技术,筛选出攻击性最强的攻击链,有效阻止部分网络攻击,减少不必要的损失,能够解决现有的攻击图生成技术时效性不高的问题。

    一种自定义动态扩展的暗网爬虫系统

    公开(公告)号:CN109902212A

    公开(公告)日:2019-06-18

    申请号:CN201910071997.2

    申请日:2019-01-25

    Abstract: 本发明公开了一种自定义动态扩展的暗网爬虫系统,包括:网页解析插件模块,对各类网页页面进行解析并将下一级站点链接输入给爬虫调度器;爬虫线程模块,负责执行各类网页爬虫过程;爬虫调度器模块,负责网页解析插件模块与爬虫线程之间的交互;并发模块,并发代理连接站点对网页页面进行下载,并且将网页页面数据输送给爬虫线程;负载均衡代理池管理模块:动态代理服务加载与管理,提供负载均衡功能。本发明保证了爬虫系统可用可维护性。动态加载tor代理池方式实现多站点页面并行下载,提高了爬虫系统完成爬取任务的时间效率。采用负载均衡代理池管理模块,对各tor代理的爬虫下载网页任务数量进行实时监控与均衡分配,实现了各tor代理的最大化使用。

    一种基于词袋模型的计算机程序分类方法

    公开(公告)号:CN109901869A

    公开(公告)日:2019-06-18

    申请号:CN201910071876.8

    申请日:2019-01-25

    Abstract: 本发明公开了一种基于词袋模型的计算机程序分类方法,将计算机程序转换为一个由自定义函数或基本块为单位的API调用序列;计算机程序提取的API调用序列是API调用的组合,一个API调用序列中每个API调用存在上下文依赖关系,利用API调用序列训练基于上下文关系的词袋模型,得到每一个API调用序列以及API调用的向量表示,通过API调用序列的欧式距离计算相似度,判定未知计算机程序的分类。本发明采用三层神经网络算法训练计算机程序代码,在很好的学习到代码的整体语义特征和上下文计算机程序代码基因的信息的同时,极大的降低了计算复杂度;基于深度学习的计算机程序的基列向量化表示和聚类方法检测具有较好的效果。

Patent Agency Ranking