-
公开(公告)号:CN111553424A
公开(公告)日:2020-08-18
申请号:CN202010356177.0
申请日:2020-04-29
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于CGAN的图像数据平衡和分类方法,主要包括两个阶段,第一阶段为生成模型训练,包括生成器G和判别器D的训练。第二阶段为分类器训练阶段,其步骤包括:加载第一阶段训练过程中判别器D训练好的模型,在判别器D的神经网络基础上,新增一个输出层对输入进行分类。本发明利用生成对抗网络在数据增强上的优势,在训练过程中引入数据类别标签作为条件变量,控制生成器生成小类别样本数据,减少样本不平衡问题对流量分类问题的影响。同时对传统CGAN进行改进,使其在样本平衡的同时可以对样本进行分类实现。
-
公开(公告)号:CN110532299A
公开(公告)日:2019-12-03
申请号:CN201910810823.3
申请日:2019-08-29
Applicant: 南京邮电大学
IPC: G06F16/2458 , G06F16/215 , G06F16/28 , G06F16/17 , G06F16/951 , G06K9/62
Abstract: 本发明公开了一种基于半监督学习的DPI数据中host的自动化挖掘方法及系统,采用爬虫的方法与浏览器交互,自动化抓取host对应的含义并提炼后获得标签,提出融合以上自动化标记方法与半监督学习的方法来实现自动化挖掘host标签,同时利用了标记数据和未标记数据,弥补了监督学习与无监督学习的不足,本发明提出在实现爬虫自动化抓取并标记host的方法上,基于半监督学习的SVM-KNN分类方法,将少量有标记的host数据与大量未标记的host数据做融合训练,对未标记的host数据做分类,最终实现自动化挖掘DPI大数据的host标签。
-
公开(公告)号:CN110704649A
公开(公告)日:2020-01-17
申请号:CN201910810810.6
申请日:2019-08-29
Applicant: 南京邮电大学
IPC: G06F16/51
Abstract: 本发明公开了一种用于构建流量图像数据集的方法及系统,包括:读取Pcap源文件,解析并过滤PCAP文件的前24个字节,代表文件头相关信息;按照Pcap包的分组信息解析各组流量信息;解析出来的信息需要经过字符串分割、正则匹配、进制转换后,将所有字节信息按照对应分组编号保存至对应txt文件;读取生成的txt文件,生成成灰度图。将Pcap包转为图像后便可将其制作成类似MNIST手写体的数据集。本发明通过对Pcap文件和数据包格式的解析,实现将Pcap文件转换为灰度图,该图可用建立深度学习模型训练的数据集,提高了流量识别在深度学习领域的适用性。
-
公开(公告)号:CN110704649B
公开(公告)日:2022-09-02
申请号:CN201910810810.6
申请日:2019-08-29
Applicant: 南京邮电大学
IPC: G06F16/51
Abstract: 本发明公开了一种用于构建流量图像数据集的方法及系统,包括:读取Pcap源文件,解析并过滤PCAP文件的前24个字节,代表文件头相关信息;按照Pcap包的分组信息解析各组流量信息;解析出来的信息需要经过字符串分割、正则匹配、进制转换后,将所有字节信息按照对应分组编号保存至对应txt文件;读取生成的txt文件,生成成灰度图。将Pcap包转为图像后便可将其制作成类似MNIST手写体的数据集。本发明通过对Pcap文件和数据包格式的解析,实现将Pcap文件转换为灰度图,该图可用建立深度学习模型训练的数据集,提高了流量识别在深度学习领域的适用性。
-
公开(公告)号:CN110602078B
公开(公告)日:2022-12-20
申请号:CN201910832196.3
申请日:2019-09-04
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于生成对抗网络的应用加密流量生成方法及系统,将真实应用的加密流量包(包括数据包头部),提取成十进制数据并截取至定长(不足位用0补齐),用逗号分隔,每一行是一条流量数据,将其送入生成对抗网络(GAN)进行特征提取,等GAN网络的生成器和判别器趋于稳定后。将少量真实应用的加密流量输入GAN的生成器,即可生成任意条数的包含该应用流量特征的加密流量。该方法通过GAN巧妙的将加密流量中的特征抽象出来,不需要对流量本身进行解密,减少了解密的工作的同时有效的保护了用户隐私并大大降低了获取样本的成本。本方法适用于所有基于深度学习的加密流量识别场景中加密流量样本少获取困难导致识别率低的场景。
-
公开(公告)号:CN111582509A
公开(公告)日:2020-08-25
申请号:CN202010378310.2
申请日:2020-05-07
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于知识图谱表示学习和神经网络的协同推荐方法,将数据集中的项目映射到公开知识图谱三元组,作为训练集输入到OpenKE框架中进行模型训练,其中同过设置参数的方式来选择采用知识图谱表示学习方法进行学习,按照顺序将实体集的对应向量矩阵E′反映射回项目个体,得到每一个项目构建好其对应的低维度稠密特征向量Ikem,将正例低维度稠密特征向量Ikem-pos和负例低维度稠密特征向量Ikem-neg读入模型中,并替换掉传统向量层操作,即为知识嵌入向量层最终输出,然后神经网络训练层开始训练,本发明能够解决评分矩阵稀疏和冷启动的问题,并增强了协同过滤推荐的性能和准确性。
-
公开(公告)号:CN111582509B
公开(公告)日:2022-09-02
申请号:CN202010378310.2
申请日:2020-05-07
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于知识图谱表示学习和神经网络的协同推荐方法,将数据集中的项目映射到公开知识图谱三元组,作为训练集输入到OpenKE框架中进行模型训练,其中同过设置参数的方式来选择采用知识图谱表示学习方法进行学习,按照顺序将实体集的对应向量矩阵E′反映射回项目个体,得到每一个项目构建好其对应的低维度稠密特征向量Ikem,将正例低维度稠密特征向量Ikem‑pos和负例低维度稠密特征向量Ikem‑neg读入模型中,并替换掉传统向量层操作,即为知识嵌入向量层最终输出,然后神经网络训练层开始训练,本发明能够解决评分矩阵稀疏和冷启动的问题,并增强了协同过滤推荐的性能和准确性。
-
公开(公告)号:CN110602078A
公开(公告)日:2019-12-20
申请号:CN201910832196.3
申请日:2019-09-04
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于生成对抗网络的应用加密流量生成方法及系统,将真实应用的加密流量包(包括数据包头部),提取成十进制数据并截取至定长(不足位用0补齐),用逗号分隔,每一行是一条流量数据,将其送入生成对抗网络(GAN)进行特征提取,等GAN网络的生成器和判别器趋于稳定后。将少量真实应用的加密流量输入GAN的生成器,即可生成任意条数的包含该应用流量特征的加密流量。该方法通过GAN巧妙的将加密流量中的特征抽象出来,不需要对流量本身进行解密,减少了解密的工作的同时有效的保护了用户隐私并大大降低了获取样本的成本。本方法适用于所有基于深度学习的加密流量识别场景中加密流量样本少获取困难导致识别率低的场景。
-
-
-
-
-
-
-