一种基于渐进式学习的集成分类方法

    公开(公告)号:CN109165672A

    公开(公告)日:2019-01-08

    申请号:CN201810774888.2

    申请日:2018-07-16

    Abstract: 本发明公开了一种基于渐进式学习的集成分类方法,同时对带噪音标签的高维数据的样本维和属性维进行数据挖掘,并结合渐进式学习原理,解决了学习训练中加入新数据后原数据信息丢失的问题;具体步骤为:(1)输入样本数据集;(2)产生训练样本的bootstrap分支集合;(3)生成分类器;(4)对样本进行分类;(5)选择第一个分类器;(6)选择渐进式分类器;(7)得到预测结果和分类准确率。本发明对高维数据样本维度和属性维度同时挖掘,构建一个强大的集成分类器;利用带有线性判别分析算法的渐进式集成学习算法提高对带噪音数据的分类能力;并将集成学习与渐进式学习相结合,提高了集成分类方法的准确性、稳定性和鲁棒性。

    一种基于数据稳定性的选择性聚类集成方法

    公开(公告)号:CN108573274A

    公开(公告)日:2018-09-25

    申请号:CN201810181682.9

    申请日:2018-03-06

    Inventor: 余志文 黄炜杰

    CPC classification number: G06K9/6223 G06K9/6288

    Abstract: 本发明公开了一种基于数据稳定性的选择性聚类集成方法,包括步骤:1)输入数据集并进行预处理;2)对数据集进行聚类结果集合生成;3)进行聚类结果筛选,得到聚类子集;4)进行样本划分,把数据集划分为稳定子集及不稳定子集;5)制定基于稳定子集及不稳定子集的目标函数,进一步筛选聚类子集;6)融合最终聚类子集,得到聚类结果。较于传统方法,本发明有以下创新点:多视角聚类,增强多样性;自动筛选合适聚类算法,避免数据假设不符合问题;设计基于数据稳定性的目标函数,具有很强的自适应性;通过指标提升程度控制多目标遗传算法收敛方向,提高收敛速度及准确性。

    基于随机子空间的高维数据软硬聚类集成方法

    公开(公告)号:CN106446947A

    公开(公告)日:2017-02-22

    申请号:CN201610843524.6

    申请日:2016-09-22

    CPC classification number: G06K9/6223

    Abstract: 本发明公开一种基于随机子空间的高维数据软硬聚类集成方法,包括以下步骤为:(1)输入高维数据集;(2)数据归一化;(3)产生随机子空间;(4)kmeans和fuzzy cmeans聚类;(5)生成融合矩阵;(6)使用聚类有效性指标得出最优聚类数目;(7)构造决策属性集;(8)改进粗糙集属性约简,得到精简融合矩阵;(9)一致性函数划分;高维数据难处理的问题;利用软聚类和硬聚类的结合,充分利用原始数据和中间结果信息;并对中间结果冗余属性约简,在提高聚类准确率的同时也提高聚类速度;解决了现有技术中对聚类信息的充分利用以及冗余信息去除的问题。(10)聚类纯净率。本发明利用随机子空间解决了

    一种高维数据半监督分类方法

    公开(公告)号:CN113033641A

    公开(公告)日:2021-06-25

    申请号:CN202110285595.X

    申请日:2021-03-17

    Abstract: 本发明公开了一种高维数据半监督分类方法,涉及人工智能半监督学习领域。主要克服制造业高维数据中数据噪声和冗余特征对模型的影响,并将子空间学习,图的构建,分类器训练整合为一个统一框架,达到更好的分类效果。其方法步骤为:1)输入训练数据集;2)数据归一化;3)参数、变量初始化;4)子空间学习;5)图的构建;6)分类器训练;7)循环重复步骤4)‑6),直至算法收敛;8)对测试样本进行分类;9)得到分类准确率。本发明从标签空间和子空间这两个低维空间来完成图的构建,有效缓解了噪声数据和冗余特征对算法模型的干扰,保证了图的质量,提升了分类效果。

    一种基于集成卷积编码的医疗问答语义聚类方法

    公开(公告)号:CN107516110B

    公开(公告)日:2020-02-18

    申请号:CN201710723583.4

    申请日:2017-08-22

    Inventor: 余志文 戴丹

    Abstract: 本发明公开了一种基于集成卷积编码的医疗问答语义聚类方法,涉及机器学习领域,所述方法包括以下步骤:医疗咨询平台用户问答语料采集,卷积核的选取,融合不同卷积核的特征表示,利用自编码机获取最终数据表征,进行医疗咨询问答语义聚类。与传统的深度学习方法相比:本方法用不同的卷积核来提取不同的特征,提取的特征更加充分和多样化,并且使用不同的特征合并方法,将提取到的特征进行融合表示,因此本发明泛化能力强,语义聚类准确率高,基于该方法能够更好地帮助用户了解自身情况,并可辅助医生进行疾病检测,对搭建医疗的自动问答系统具有很大的应用价值。

    基于多目标优化的高维数据半监督集成分类方法

    公开(公告)号:CN106778832B

    公开(公告)日:2019-10-18

    申请号:CN201611064898.4

    申请日:2016-11-28

    Abstract: 本发明公开了一种基于多目标优化的高维数据半监督集成分类方法,涉及人工智能集成学习领域,主要解决现有技术中对子空间优化和选择以及半监督信息利用的问题。该高维数据半监督集成分类方法包括下列步骤:S1、输入训练数据集;S2、对输入的上述训练数据集进行数据归一化;S3、产生随机子空间集合;S4、多目标优化选取子空间集合;S5、寻找特征子空间中最优半监督分类器;S6、对测试样本进行分类;S7、计算分类准确率。本发明利用随机子空间解决了高维数据难处理的问题;利用多目标优化的解决方法,充分优化子空间的选择来提高子空间的鲁棒性;并充分利用无标签和有标签的信息来优化子空间的分类器,提高分类器的泛化能力。

    自适应迭代式卷积神经网络模型压缩方法

    公开(公告)号:CN109002889A

    公开(公告)日:2018-12-14

    申请号:CN201810715248.4

    申请日:2018-07-03

    Inventor: 余志文 马帅

    Abstract: 本发明公开了一种自适应迭代式卷积神经网络模型压缩方法,包括:对训练数据进行预处理,用训练数据对卷积神经网络进行训练,选出最优模型作为需要压缩的模型,用自适应迭代式卷积神经网络模型压缩方法对模型进行压缩,对压缩后的模型进行评估,选出最优模型作为压缩完成的模型。本发明具有以下优点:自适应调整量化比例,参数少;自适应迭代式压缩,可以提高模型压缩后的准确率;支持常见的卷积神经网络模型压缩,且可以根据需要压缩到特定位数,因此本发明的方法可以高效地压缩卷积神经网络模型并将模型应用到移动设备上。

    一种基于图嵌入加权宽度网络的网络入侵检测方法

    公开(公告)号:CN119652575A

    公开(公告)日:2025-03-18

    申请号:CN202411725708.3

    申请日:2024-11-28

    Abstract: 本发明公开了一种基于图嵌入加权宽度网络的网络入侵检测方法,包括:收集网络入侵检测数据并进行预处理;使用预处理后的网络入侵检测数据计算样本构建一个图嵌入矩阵;利用预处理后的网络入侵数据计算类惩罚权重;将得到的图嵌入矩阵和类惩罚权重加入到一个宽度神经网络中,得到一个改进的宽度神经网络,称为图嵌入加权宽度网络;使用训练后的图嵌入加权宽度网络对待测的网络入侵检测数据进行分类,得到分类结果。本发明通过利用宽度网络高效的训练方式和高精确性优点的同时,引入图嵌入技术提高了对网络入侵数据的分类能力,并使用自适应加权惩罚矩阵加强宽度网络在训练过程中对少数类的关注,有助于提高网络入侵检测数据分类的准确性。

    基于集成学习与主动学习的网络钓鱼页面识别方法

    公开(公告)号:CN119449398A

    公开(公告)日:2025-02-14

    申请号:CN202411509879.2

    申请日:2024-10-28

    Abstract: 本发明公开了一种基于集成学习与主动学习的网络钓鱼页面识别方法,包括:收集网络页面并处理为初始数据集;对初始数据集聚类,构建簇集合;对簇集合中的簇训练单类宽度学习系统,分配权重构建第一集成学习模型;设立缓冲区暂存无法识别的页面,并聚类后识别类型,再训练单类宽度学习系统加入第一集成学习模型,形成第二集成学习模型;设计权重调整机制,适应钓鱼页面变化;利用第二集成学习模型对页面进行识别,若失败则送至缓冲区;若成功则计算置信度分数,并选择最高分数的数据标签来确定页面是否为钓鱼页面。本发明能够减少钓鱼页面识别过程中专业人员的参与,并保持优秀的识别成功率,为网络安全领域提供了一种有效的解决方案。

Patent Agency Ranking