敏感信息识别方法、装置、电子设备及存储介质

    公开(公告)号:CN118113867A

    公开(公告)日:2024-05-31

    申请号:CN202410131228.8

    申请日:2024-01-30

    Abstract: 本说明书提供一种敏感信息识别方法、装置、电子设备及存储介质,所述方法包括:从待识别的流数据中提取实体序列,所述实体序列包括至少一个实体;将所述实体序列输入预训练的分类模型,所述分类模型包括基于被标记了是否包含敏感信息的样本实体序列进行训练而得到的机器学习模型;获取所述分类模型输出的第一识别结果,所述第一识别结果用于指示所述实体序列是否包含敏感信息。本说明书的技术方案不再仅从单个实体的角度判断是否为敏感信息,而是通过判断数据流中的多个实体构成的实体序列是否为敏感信息,实现识别数据流是否为敏感数据流,从而提高数据流敏感信息的识别准确性。

    模型生成方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN114297924A

    公开(公告)日:2022-04-08

    申请号:CN202111614410.1

    申请日:2021-12-27

    Abstract: 本申请提供了一种模型生成方法,包括:将至少一种向量生成方法、与至少两种域名检测算法进行组合,得到至少两种组合方式;对于每种组合方式,采用该组合方式下的向量生成方法,对域名样本库中的各个样本域名进行域名向量化,且基于生成的域名向量,采用该组合方式下的域名检测算法进行模型训练,得到该组合方式对应的待选域名检测模型;根据每种组合方式对应的待选域名检测模型的模型选择指标,选择一个待选域名检测模型,作为目标域名检测模型,以便利用目标域名检测模型进行域名检测。本申请能够在节省人力的情况下生成目标域名检测模型,且保证了域名检测时的准确性。本申请还提供了一种模型生成装置、设备及计算机可读存储介质。

    非法域名注册团伙挖掘方法及装置

    公开(公告)号:CN112910888A

    公开(公告)日:2021-06-04

    申请号:CN202110127589.1

    申请日:2021-01-29

    Inventor: 史卓颖 王涛

    Abstract: 本申请提供了非法域名注册团伙挖掘方法及装置。一种非法域名注册团伙挖掘方法,包括:获取待进行注册团伙挖掘的多个非法域名,并获取所述多个非法域名的目标属性的属性值;根据所述非法域名和所述非法域名的目标属性的属性值绘图,包括:将每一非法域名作为图中的一个节点,若所述非法域名中任意两个非法域名的目标属性的属性值相同,则连接这两个非法域名在图中对应的节点;基于绘制完成的图运行Louvain算法,将通过Louvain算法划分出的每一社区作为一个非法域名注册团伙。通过上述方法,本申请能够全面、准确地挖掘非法域名注册团伙,为进一步惩治非法域名注册团伙奠定基础。

    一种基于多特征融合的邮件分类方法、装置及电子设备

    公开(公告)号:CN117221001A

    公开(公告)日:2023-12-12

    申请号:CN202311413662.7

    申请日:2023-10-26

    Abstract: 本说明书提供一种基于多特征融合的邮件分类方法、装置及电子设备,所述方法包括:提取待分类邮件中不同类型的构成对象;针对每种类型的构成对象分别进行特征提取,以生成用于表征相应构成对象的表征向量;将生成的对应于各个构成对象的表征向量进行融合,以获得融合向量;将所述融合向量输入到分类模型中,以获得针对所述待分类邮件的分类结果。

    基于字节分析的DNS隧道识别方法及装置

    公开(公告)号:CN115865490A

    公开(公告)日:2023-03-28

    申请号:CN202211522252.1

    申请日:2022-11-30

    Inventor: 史卓颖

    Abstract: 本申请涉及一种基于字节分析的DNS隧道识别方法、装置、电子设备及计算机可读介质。该方法包括:将实时DNS流量按照预设策略分为多个数据组;提取多个数据组对应的多个DNS层信息;基于字节分析将多个DNS层信息转化为多个输入数据;将所述多个输入数据输入隧道识别模型中,生成识别概率;在所述识别概率大于阈值时,确定所述实时DNS流量为DNS隧道流量。本申请涉及的基于字节分析的DNS隧道识别方法、装置、电子设备及计算机可读介质,能够缓解模型面临数据量,全装置性能等问题,从而实现从byte的角度进行DNS检测。

    基于面向攻击行为跟踪的自适应时频特征提取的检测方法

    公开(公告)号:CN118400203B

    公开(公告)日:2024-09-03

    申请号:CN202410852478.0

    申请日:2024-06-27

    Abstract: 本公开提供了一种基于面向攻击行为跟踪的自适应时频特征提取的检测方法,所述方法包括将待检测网络流量数据划分为多个流量子序列,针对每一流量子序列,利用通过对所述流量子序列中不同频率范围的数据进行优化得到的目标小波变换参数(即小波基、层数和尺度参数),对所述流量子序列进行小波变换得到第一特征集,并根据所有的第一特征集的融合特征,确定所述待检测网络流量的检测结果。本公开针对每个窗口内的流量子序列,根据该流量子序列中不同频率范围的数据确定对该流量子序列进行小波变换的目标小波变换参数,从而提高利用小波变换进行特征提取时的准确性,进而提高检测结果的准确性。

    一种用户异常监测方法、装置、电子设备及存储介质

    公开(公告)号:CN116450482A

    公开(公告)日:2023-07-18

    申请号:CN202310412127.3

    申请日:2023-04-14

    Abstract: 本申请提供了一种用户异常监测方法、装置、电子设备及存储介质,所述用户异常监测方法包括:获取目标用户的待检日志数据,对所述待检日志数据进行序列划分,得到待检时序数据集合和待检白噪声数据集合,所述时序数据集合中的数据之间存在时序关系,所述白噪声数据集合中的数据之间不存在时序关系;基于所述时序数据集合中的数据与动态基线的偏离度,对待检时序数据进行异常操作监测,所述动态基线根据历史时序数据预测得到;基于离群检测方法,对待检白噪声数据进行异常操作监测,所述离群检测方法所使用的标准差值根据历史白噪声数据计算得到。

    一种识别加密恶意报文流的方法及装置

    公开(公告)号:CN113177203B

    公开(公告)日:2022-04-26

    申请号:CN202110400149.9

    申请日:2021-04-14

    Inventor: 史卓颖 王涛

    Abstract: 本说明书提供一种识别加密恶意报文流的方法,由于在识别加密报文流是否为恶意流量时,最重要的是能否提取出能够表征加密恶意报文流的特征,而在加密报文流中,各相邻的报文间的可识别特征(与加密的负载部分无关的特征)一般都是有关联关系的,因此通过统计每相邻两个报文间的报文特征关联关系,得到各个报文特征之间的关联概率矩阵。然后根据对多个加密报文流所提取的关联概率矩阵以及每个加密报文流对应的标签,进行模型训练,得到用于识别加密恶意报文流的模型,如此,便可使用该训练好的模型对未知属性的报文流进行识别,确定该未知属性报文流是恶意的还是非恶意的。

    一种识别加密恶意报文流的方法及装置

    公开(公告)号:CN113177203A

    公开(公告)日:2021-07-27

    申请号:CN202110400149.9

    申请日:2021-04-14

    Inventor: 史卓颖 王涛

    Abstract: 本说明书提供一种识别加密恶意报文流的方法,由于在识别加密报文流是否为恶意流量时,最重要的是能否提取出能够表征加密恶意报文流的特征,而在加密报文流中,各相邻的报文间的可识别特征(与加密的负载部分无关的特征)一般都是有关联关系的,因此通过统计每相邻两个报文间的报文特征关联关系,得到各个报文特征之间的关联概率矩阵。然后根据对多个加密报文流所提取的关联概率矩阵以及每个加密报文流对应的标签,进行模型训练,得到用于识别加密恶意报文流的模型,如此,便可使用该训练好的模型对未知属性的报文流进行识别,确定该未知属性报文流是恶意的还是非恶意的。

    基于面向攻击行为跟踪的自适应时频特征提取的检测方法

    公开(公告)号:CN118400203A

    公开(公告)日:2024-07-26

    申请号:CN202410852478.0

    申请日:2024-06-27

    Abstract: 本公开提供了一种基于面向攻击行为跟踪的自适应时频特征提取的检测方法,所述方法包括将待检测网络流量数据划分为多个流量子序列,针对每一流量子序列,利用通过对所述流量子序列中不同频率范围的数据进行优化得到的目标小波变换参数(即小波基、层数和尺度参数),对所述流量子序列进行小波变换得到第一特征集,并根据所有的第一特征集的融合特征,确定所述待检测网络流量的检测结果。本公开针对每个窗口内的流量子序列,根据该流量子序列中不同频率范围的数据确定对该流量子序列进行小波变换的目标小波变换参数,从而提高利用小波变换进行特征提取时的准确性,进而提高检测结果的准确性。

Patent Agency Ranking