-
公开(公告)号:CN110502552A
公开(公告)日:2019-11-26
申请号:CN201910770010.6
申请日:2019-08-20
Applicant: 重庆大学
IPC: G06F16/2458 , G06F16/215 , G06N20/00
Abstract: 本发明涉及数据预处理的数据挖掘或机器学习领域,本发明提出的一种基于微调条件概率的分类数据转换方法,包括:S1、分类数据的数据采集;S2、数据预处理,清洗分类数据中的缺失数据,噪音数据,以及无效数据;S3、条件概率计算,将清洗以后的分类数据转换为数值向量;S4、微调条件概率,对步骤S3中转换后的数值向量进行数值微调;S5、分类数据的数值嵌入,对步骤S4中进行数值微调以后的数值向量,采用原始的分类数据嵌入或映射为数值数据。本发明可将分类数据集中的分类值转换为高质量的数值向量,转换后的数值数据能保持原始数据的真实分布,保证了数据挖掘任务的可靠性。
-
公开(公告)号:CN110502552B
公开(公告)日:2022-10-28
申请号:CN201910770010.6
申请日:2019-08-20
Applicant: 重庆大学
IPC: G06F16/2458 , G06F16/215 , G06N20/00
Abstract: 本发明涉及数据预处理的数据挖掘或机器学习领域,本发明提出的一种基于微调条件概率的分类数据转换方法,包括:S1、分类数据的数据采集;S2、数据预处理,清洗分类数据中的缺失数据,噪音数据,以及无效数据;S3、条件概率计算,将清洗以后的分类数据转换为数值向量;S4、微调条件概率,对步骤S3中转换后的数值向量进行数值微调;S5、分类数据的数值嵌入,对步骤S4中进行数值微调以后的数值向量,采用原始的分类数据嵌入或映射为数值数据。本发明可将分类数据集中的分类值转换为高质量的数值向量,转换后的数值数据能保持原始数据的真实分布,保证了数据挖掘任务的可靠性。
-
公开(公告)号:CN110334869A
公开(公告)日:2019-10-15
申请号:CN201910612175.0
申请日:2019-08-15
Applicant: 重庆大学
Abstract: 本发明公开了一种基于动态群优化算法的红树林生态健康预测训练方法,包括步骤A,数据预处理;步骤A1,基于PSO算法的数据生成模块;步骤A2,基于相对熵和余弦相似度的相似性评估模块;步骤B,基于DGO算法进行模型训练;步骤B1,组内合作;步骤B2,每一组的质心与其他组的质心进行通信;步骤B3,每一组的成员与种群内的其他成员进行随机交叉;步骤B4,在每一质心之间的通信和每一成员的随机交叉过程中,搜寻所述突变情况,基于该突变情况查出与此对应的成员,将该成员随机转移到其它组;步骤C,结合BP算法和DGO算法配合步骤B进行前馈神经网络的训练。本发明提高了预测数据的准确性以及训练模型的完整度。
-
-