文本敏感性检测方法、装置、电子设备及可读存储介质

    公开(公告)号:CN117313695B

    公开(公告)日:2024-07-30

    申请号:CN202311138419.9

    申请日:2023-09-01

    申请人: 鹏城实验室

    摘要: 本申请实施例提供了一种文本敏感性检测方法、装置、电子设备及计算机可读存储介质,属于智能识别技术领域。该方法包括:获取待检测文本内容;对待检测文本内容进行脱敏处理得到多个脱敏文本;根据预设的AC自动机对各个脱敏文本进行匹配处理,在脱敏文本匹配为独立性敏感文本的情况下,根据预训练的上下文敏感信息检测模型对相应的脱敏文本进行检测处理得到检测结果;在检测结果表征对应的脱敏文本为上下文敏感文本的情况下,对脱敏文本进行屏蔽处理;在检测结果表征对应的脱敏文本不为上下文敏感文本的情况下,输出脱敏文本。本申请实施例使得文本敏感性检测的过程更加稳定可靠。

    文本检测方法、装置、设备和存储介质

    公开(公告)号:CN117332039A

    公开(公告)日:2024-01-02

    申请号:CN202311218607.2

    申请日:2023-09-20

    申请人: 鹏城实验室

    摘要: 本申请实施例提供文本检测方法、装置、设备和存储介质,涉及人工智能技术领域。该方法包括:利用预设检测词表初步将包含敏感词的检测文本筛选出来,再利用多个安全检测模型对初筛后的检测文本更细粒度的合规性判断,得到表征合规性的检测得分,这里检测得分越高表征检测文段的安全性越高。在后续检测过程中,本实施例并不仅简单地将所有检测文段的检测得分通过作为合规性结果,而是预留一定的冗余,虽然一些检测文段的检测得分没有通过,但是其数量较少,则也可以认为其合规。通过多阶段检测,从粗粒度到细粒度进行合规判断,能够在整体上降低检测文本被误检的概率。

    网络传输数据的检测方法、装置、计算机设备及存储介质

    公开(公告)号:CN116865996A

    公开(公告)日:2023-10-10

    申请号:CN202310645362.5

    申请日:2023-06-01

    IPC分类号: H04L9/40

    摘要: 本申请实施例提供了一种网络传输数据的检测方法和装置、计算机设备及存储介质,属于网络安全技术领域。该方法包括:获取待检测的网络传输数据;基于语义表征模型对网络传输数据进行特征提取,得到时域特征数据;将网络传输数据转换为时序序列数据,并对时序序列数据进行时频转换,得到第一频域特征数据;提取网络传输数据的统计特征,并基于统计特征生成表征图像;对表征图像进行频域转换,得到第二频域特征数据;基于时域特征数据、第一频域特征数据和第二频域特征数据进行数据检测,得到待检测的网络传输数据的检测结果。本申请实施例能够提升对网络传输数据进行检测的检测效率和检测准确性。

    恶意流量的检测方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN116319076A

    公开(公告)日:2023-06-23

    申请号:CN202310540038.7

    申请日:2023-05-15

    申请人: 鹏城实验室

    IPC分类号: H04L9/40

    摘要: 本申请公开了一种恶意流量的检测方法、装置、设备及计算机可读存储介质,该方法包括:将待检测流量数据分别输入至不同恶意流量检测模型得到多个初步检测结果,其中,各恶意流量检测模型分别基于不同恶意流量对抗样本集训练得到;基于各初步检测结果以及各初步检测结果之间的相似度得到待检测流量数据的综合检测结果。即本申请使用多个不同恶意流量检测模型对待检测流量数据进行检测,再根据多个初步检测结果和各初步检测结果之间的相似度综合判断待检测流量数据是否为异常流量。在面对恶意流量的进攻时,各恶意流量检测模型之间可形成互补,有效避免恶意流量能够逃逸某一类型检测网络的检测,从而恶意流量的检测方法的鲁棒性。

    文本敏感性检测方法、装置、电子设备及可读存储介质

    公开(公告)号:CN117313695A

    公开(公告)日:2023-12-29

    申请号:CN202311138419.9

    申请日:2023-09-01

    申请人: 鹏城实验室

    摘要: 本申请实施例提供了一种文本敏感性检测方法、装置、电子设备及计算机可读存储介质,属于智能识别技术领域。该方法包括:获取待检测文本内容;对待检测文本内容进行脱敏处理得到多个脱敏文本;根据预设的AC自动机对各个脱敏文本进行匹配处理,在脱敏文本匹配为独立性敏感文本的情况下,根据预训练的上下文敏感信息检测模型对相应的脱敏文本进行检测处理得到检测结果;在检测结果表征对应的脱敏文本为上下文敏感文本的情况下,对脱敏文本进行屏蔽处理;在检测结果表征对应的脱敏文本不为上下文敏感文本的情况下,输出脱敏文本。本申请实施例使得文本敏感性检测的过程更加稳定可靠。

    恶意流量的检测方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN116319076B

    公开(公告)日:2023-08-25

    申请号:CN202310540038.7

    申请日:2023-05-15

    申请人: 鹏城实验室

    IPC分类号: H04L9/40

    摘要: 本申请公开了一种恶意流量的检测方法、装置、设备及计算机可读存储介质,该方法包括:将待检测流量数据分别输入至不同恶意流量检测模型得到多个初步检测结果,其中,各恶意流量检测模型分别基于不同恶意流量对抗样本集训练得到;基于各初步检测结果以及各初步检测结果之间的相似度得到待检测流量数据的综合检测结果。即本申请使用多个不同恶意流量检测模型对待检测流量数据进行检测,再根据多个初步检测结果和各初步检测结果之间的相似度综合判断待检测流量数据是否为异常流量。在面对恶意流量的进攻时,各恶意流量检测模型之间可形成互补,有效避免恶意流量能够逃逸某一类型检测网络的检测,从而恶意流量的检测方法的鲁棒性。

    一种互联网攻击预测方法、系统、设备及介质

    公开(公告)号:CN116599705A

    公开(公告)日:2023-08-15

    申请号:CN202310475618.2

    申请日:2023-04-25

    摘要: 本发明公开了一种互联网攻击预测方法、系统、设备及介质,其方法包括:获取蠕虫攻击的告警信息;根据告警信息的源IP地址和目的IP地址进行分类聚合,得到源IP地址相同而目的IP地址不相同的聚合告警序列;对聚合告警序列进行相似性度量处理后得到目的IP地址不相同的告警信息之间的相关矩阵;通过相关矩阵获取蠕虫攻击在每个传播环节之间的关联强度,并根据关联强度预测蠕虫攻击的下一个攻击目标。本发明能够准确通过聚合告警序列提高了告警信息的可利用度,并将聚合告警序列转换为相关矩阵,根据相关矩阵获取蠕虫攻击在每个传播环节之间的关联强度,准确量化计算预测蠕虫攻击的下一个攻击目标,大大提高了预测的细粒度和精度。

    中心事件的提取方法、设备及介质

    公开(公告)号:CN116167359A

    公开(公告)日:2023-05-26

    申请号:CN202310183236.2

    申请日:2023-02-20

    申请人: 鹏城实验室

    摘要: 本发明公开了一种中心事件的提取方法、设备及介质,包括以下步骤:通过确定待提取文本中所包括的各单句分别与待提取文本的标题的相似度、各单句中所包括的触发词的第一权重,以及各单句中所包括的网络安全实体的第二权重后,根据各单句的相似度、第一权重和第二权重确定中心句,确定中心句中所包含的触发词,基于触发词确定中心句指向的事件类型,通过BiLSTM模型和CRF模型对中心句和事件类型进行计算,得到中心事件,通过三个维度来确定中心句,缩小了抽取范围,降低了次要事件对中心句的抽取的干扰,通过BiLSTM模型和CRF模型降低了流水线提取中心事件的方式存在的误差,以此提升了中心事件提取任务的便捷性和有效性。

    文本检测方法、装置、设备和存储介质

    公开(公告)号:CN117332039B

    公开(公告)日:2024-07-02

    申请号:CN202311218607.2

    申请日:2023-09-20

    申请人: 鹏城实验室

    摘要: 本申请实施例提供文本检测方法、装置、设备和存储介质,涉及人工智能技术领域。该方法包括:利用预设检测词表初步将包含敏感词的检测文本筛选出来,再利用多个安全检测模型对初筛后的检测文本更细粒度的合规性判断,得到表征合规性的检测得分,这里检测得分越高表征检测文段的安全性越高。在后续检测过程中,本实施例并不仅简单地将所有检测文段的检测得分通过作为合规性结果,而是预留一定的冗余,虽然一些检测文段的检测得分没有通过,但是其数量较少,则也可以认为其合规。通过多阶段检测,从粗粒度到细粒度进行合规判断,能够在整体上降低检测文本被误检的概率。