一种从大数据中提取用于网络安全的训练数据方法和装置

    公开(公告)号:CN113810386B

    公开(公告)日:2023-09-26

    申请号:CN202110998172.2

    申请日:2021-08-27

    IPC分类号: H04L9/40 G06N20/00

    摘要: 本申请公开了一种从大数据中提取用于网络安全的训练数据方法和系统,该方法包括:抓取来自网络的数据包并进行缓存;获取防火墙的判断结果,以及判断结果发生的第一时间,其中,判断结果用于指示防火墙受到网络攻击;从缓存的数据包中获取从第一时间开始向前的预定时长内的所有数据包;将获取到的所有数据包按照接收数据包的时间先后进行排序;将排序后的数据包作为一组数据包,并为一组数据包打上标签,其中,标签用于指示该组数据包的出现伴随了网络攻击的发生;将一组数据包和标签作为训练数据进行保存。通过本申请解决了人工收集网络安全训练数据所导致的效率比较低的问题,从而提高了网络安全训练数据收集的效率。