用于检测恶意流量的方法、装置及存储介质

    公开(公告)号:CN118449733A

    公开(公告)日:2024-08-06

    申请号:CN202410523095.9

    申请日:2024-04-28

    Inventor: 刘微

    Abstract: 本申请公开了一种用于检测恶意流量的方法、装置及存储介质。方法包括:获取网络流量的入栈数据包,入栈数据包包括多个包头;确定与每个包头对应的目标词汇;将全部的目标词汇按照多个包头的顺序排序以生成目标序列;确定目标序列包括的每个目标词汇对应的词向量;将全部的词向量按照目标序列的词汇顺序生成与目标序列对应的词向量序列;将词向量序列输入至预设模型,以通过预设模型输出词向量序列对应的预测概率;根据预测概率确定入栈数据包对应的网络流量为正常流量或恶意流量。在不将数据包预处理为特定流的情况下,提取从每个数据包构建目标序列的语义和语法特征,将传入的数据包分为良性或恶意类,可以提高检测效率。

    文本分类方法、装置、电子设备及存储介质

    公开(公告)号:CN117407530A

    公开(公告)日:2024-01-16

    申请号:CN202311443529.6

    申请日:2023-11-01

    Inventor: 刘微

    Abstract: 本申请提供一种文本分类方法、装置、电子设备及存储介质。该方法包括:对待分类文本进行处理,获得待分类文本对应的文本特征向量;将文本特征向量输入预先训练好的文本分类模型中,获得文本分类模型输出的待分类文本对应的分类结果;分类结果用于表征待分类文本对应的攻击意图分类;其中,文本分类模型为利用训练文本和测试文本获得偏差校正权重,并利用偏差校正权重对训练文本进行校正后获得的校正后训练文本训练分类器获得,且训练文本和测试文本的来源不同。本申请实施例通过偏差校正权重对训练文本进行偏差校正,从而利用偏差校正后的训练文本训练文本分类模型,提高了文本分类模型的泛化能力,从而提高了对文本分类的准确性。

    实体标记方法、电子设备、存储介质及计算机程序产品

    公开(公告)号:CN119538909A

    公开(公告)日:2025-02-28

    申请号:CN202411607888.5

    申请日:2024-11-12

    Inventor: 刘微

    Abstract: 本申请提供一种实体标记方法、电子设备、存储介质及计算机程序产品。该方法包括:基于预设的特征函数集获得待标记文本中的每个单词被标记为预先设定的各标签的特征向量;特征向量中的元素值与特征函数集中的特征函数对应,元素值为利用对应的特征函数对当前单词、当前单词的前一个词、当前单词的前两个词、当前单词的标签、前一个词的标签和前两个词的标签中的至少一个进行规则验证获得;将特征向量输入实体标记模型,获得实体标记模型输出的单词属于各个标签的条件概率;实体标记模型为基于训练样本,利用平均感知器算法对最大熵模型进行训练获得;根据条件概率确定单词对应的目标实体标签。本申请减少了人工分析时间和计算机的计算成本。

Patent Agency Ranking