-
公开(公告)号:CN113792812A
公开(公告)日:2021-12-14
申请号:CN202111117004.4
申请日:2021-09-23
Applicant: 四川大学
Abstract: 本发明涉及法律服务领域,具体涉及一种基于XGboost的两阶段离婚判决方法与系统,包括对样本中离婚双方数据进行预处理,得到完备样本;将完备样本拆分成训练集和测试集并消除变量的不平衡性;利用XGboost对训练集初步进行拟合,并根据拟合得分对初步筛选变量进行筛选,得到第一阶段XGboost模型;基于第一阶段XGboost模型和投票算法得到可识别数据集和未识别数据集:对于可识别数据集,利用第一阶段所筛选的变量并结合第一阶段XGboost模型进行拟合预测,对于未识别数据集,重新定位原始数据,重新筛选变量,利用XGboost进行第二次模型构造与预测,从而可以保证模型根据数据特性因地制宜,提高预测准确性。
-
公开(公告)号:CN113128589A
公开(公告)日:2021-07-16
申请号:CN202110418168.4
申请日:2021-04-19
Applicant: 四川大学
Abstract: 本发明公开了一种解决不平衡分类问题的新型过采样方法及系统,其中,解决不平衡分类问题的新型过采样方法是一种SMOTE的改进方法,在应用SMOTE模型之后使用基于分类器集成的噪声过滤机制对数据进行清理,可以去除由合成样本引入的新噪声,以及原始训练集中存在的多数类样本噪声和少数类样本噪声,解决SMOTE对少数类样本噪声敏感的缺点,并提高不均衡分类算法的性能。该方法能够有效识别SMOTE算法引入的新噪声,以及原始训练集中存在的多数类样本噪声和少数类样本噪声,且与现有技术相比具有更优的噪声样本识别效果,能保证最终得到的训练集为平衡数据集,使得运用传统分类方法对训练集进行训练是不会造成错误率的偏差。
-