-
公开(公告)号:CN101770520A
公开(公告)日:2010-07-07
申请号:CN201010118484.1
申请日:2010-03-05
Applicant: 南京邮电大学
IPC: G06F17/30
Abstract: 本发明公布了一种基于用户浏览行为的用户兴趣建模方法,该方法包括两个部分:显式构建用户兴趣模型和隐式更新用户兴趣模型。显式构建用户兴趣模型是通过用户注册对用户兴趣模型的初步确立以及初始化的过程,隐式更新用户兴趣模型是在不需要用户参与的情况下,根据访问者对Web页面的访问情况来分析研究用户访问的偏好。该方法能自动发现用户的新兴趣,并能对用户兴趣模型中兴趣度低的特征项进行剔除。这样一方面能更好的监测到用户兴趣的变化,另一方面也能及时控制用户兴趣模型无限制增长,提高了兴趣模型的稳定性。
-
公开(公告)号:CN101609450A
公开(公告)日:2009-12-23
申请号:CN200910030709.5
申请日:2009-04-10
Applicant: 南京邮电大学
IPC: G06F17/30
Abstract: 基于训练集网页自动分类方法,分类过程由特征选取,特征权值确定,文本向量比较等方法的结合。基于分类体系的自动分类法主要是根据事先建立好的类别模型即训练集,将待分类文档归入相应类别。随着多媒体技术的发展,网页信息的内容形式也丰富多彩,不仅包括文本信息,还包括很多的结构信息,以及声音、图形、图像等其他形式信息。但是,由于基于文本的网页仍然占有较大的比例,因此基于网页文本分类仍然占主导地位。本方法有可靠的理论支持、良好的可扩展性和准确性,且易于与运营商相关的应用接口对接。
-
公开(公告)号:CN1822548A
公开(公告)日:2006-08-23
申请号:CN200610039059.7
申请日:2006-03-24
Applicant: 南京邮电大学
Abstract: 基于对等网络的分布式流量管理方法利用第三代P2P架构,通过所有网内用户安装的客户端软体,与网络中部署的特殊服务器配合,实现网内用户访问网络的流量管理与控制。该方法采用第三代对等网络架构,即采用对等网络原理在每个网络用户端实现分布式网络流量识别与管理;该方法功能实体包括普通节点、超级节点和认证服务器、目录服务器、策略服务器和信息服务器;此外,该方法采用反馈机制,根据网络负载状况制定流量管理策略,该方法流量识别高效准确、降低了流量管理设备负载和成本、能够实现网内流量管理。
-
公开(公告)号:CN119854227A
公开(公告)日:2025-04-18
申请号:CN202510338103.7
申请日:2025-03-21
Applicant: 南京邮电大学
IPC: H04L47/2483 , H04L67/1042 , G06N3/098
Abstract: 本发明公开了一种网络流量的联邦学习泛化方法及系统,属于通信网络技术领域,首先采集联邦学习环境下不同网络节点的数据概要,通过智能节点选择方法动态选择网络节点作为联邦学习的参与客户端,确定参与每一轮模型训练的网络节点集合。利用自适应聚类算法自动将参与每一轮模型训练的网络节点集合分组成若干个数据分布相近的群组。通过基于自适应聚类的群组专属模型训练方法为群组独立训练一个模型分支,通过多模型分支智能融合方法将所有模型分支的学习成果整合到主模型中,使主模型能够综合各个模型分支的知识。本发明能够显著提升模型在未见过的数据分布上的泛化能力,进而提高网络通信的数据流业务识别精度。
-
公开(公告)号:CN118194977A
公开(公告)日:2024-06-14
申请号:CN202410364004.1
申请日:2024-03-28
Applicant: 南京邮电大学
IPC: G06N3/098 , G06N3/0985 , G06N3/045 , G06N3/0464
Abstract: 本发明公开了一种基于BERT模型优化预训练模型聚合的联邦学习方法及系统,用于解决在分布式环境下进行自然语言处理任务的问题。本发明提出了基于BERT和CNN架构的联邦学习模型,该模型首先通过预训练BERT模型来捕捉语义信息,然后利用CNN架构进行特征提取和分类。在联邦学习过程中,选择一部分客户端进行模型训练,并通过参数聚合和更新来实现模型的协同训练。最后,通过模型优化和全局模型聚合来提高模型性能,并选择表现最佳的模型作为最终输出。实验结果表明,该联邦学习模型在自然语言处理任务中具有较好的性能和可扩展性。
-
公开(公告)号:CN111651642B
公开(公告)日:2022-10-04
申请号:CN202010298213.2
申请日:2020-04-16
Applicant: 南京邮电大学
IPC: G06F16/903 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于改进型TEXT‑GAN的流量数据集生成方法,包括步骤:1.读取流量数据集。2.过滤掉数据集中无用的局域网数据包。3.将数据集格式从16进制转换成10进制。4.统一数据集中数据维度。5.将数据归一化,限定在[0,1]范围内。6.将处理后的数据放入基于Self‑Attention机制改进的TEXT‑GAN网络中训练。7.利用训练完成的生成器生成流量数据。本发明利用Self‑Attention机制代替原Text‑GAN网络生成器中的LSTM网络,提出一种改进型TEXT‑GAN生成方法用于流量数据生成。相比原TEXT‑GAN网络,改进型TEXT‑GAN大幅度提高了流量数据生成的速度与稳定性。
-
公开(公告)号:CN111553424A
公开(公告)日:2020-08-18
申请号:CN202010356177.0
申请日:2020-04-29
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于CGAN的图像数据平衡和分类方法,主要包括两个阶段,第一阶段为生成模型训练,包括生成器G和判别器D的训练。第二阶段为分类器训练阶段,其步骤包括:加载第一阶段训练过程中判别器D训练好的模型,在判别器D的神经网络基础上,新增一个输出层对输入进行分类。本发明利用生成对抗网络在数据增强上的优势,在训练过程中引入数据类别标签作为条件变量,控制生成器生成小类别样本数据,减少样本不平衡问题对流量分类问题的影响。同时对传统CGAN进行改进,使其在样本平衡的同时可以对样本进行分类实现。
-
公开(公告)号:CN110532299A
公开(公告)日:2019-12-03
申请号:CN201910810823.3
申请日:2019-08-29
Applicant: 南京邮电大学
IPC: G06F16/2458 , G06F16/215 , G06F16/28 , G06F16/17 , G06F16/951 , G06K9/62
Abstract: 本发明公开了一种基于半监督学习的DPI数据中host的自动化挖掘方法及系统,采用爬虫的方法与浏览器交互,自动化抓取host对应的含义并提炼后获得标签,提出融合以上自动化标记方法与半监督学习的方法来实现自动化挖掘host标签,同时利用了标记数据和未标记数据,弥补了监督学习与无监督学习的不足,本发明提出在实现爬虫自动化抓取并标记host的方法上,基于半监督学习的SVM-KNN分类方法,将少量有标记的host数据与大量未标记的host数据做融合训练,对未标记的host数据做分类,最终实现自动化挖掘DPI大数据的host标签。
-
公开(公告)号:CN106533977B
公开(公告)日:2019-05-17
申请号:CN201610944130.X
申请日:2016-11-02
Applicant: 南京邮电大学
Inventor: 王攀
IPC: H04L12/863 , H04L29/08 , G06F17/50
Abstract: 本发明公开了一种云数据中心的数据处理方法,所述方法包括如下步骤:I、确定生产者消费者模型;II、判断策略执行条件;III、执行相应的策略;IV、执行完毕。本发明介绍了一种云数据中心数据处理策略,该策略基于环形队列的新型多消费者数据模型,根据消费者的三种处理方式,在单生产者和双消费者的实验环境下,设计三种情况下的处理策略,保证消费者可以迅速找到当前没有处理过的数据包,进而加快数据包的处理速度。同时,通过设定queue_size和M值,尽可能的减少消费者对数据包的重复处理,实现了用最小的消耗达到高速处理数据的目的。
-
-
-
-
-
-
-
-
-