发明公开
- 专利标题: 基于深度学习的不平衡数据的均衡采样及建模方法
- 专利标题(英): Deep learning-based balanced sampling and modeling method for unbalanced data
-
申请号: CN201810637767.3申请日: 2018-06-20
-
公开(公告)号: CN108921208A公开(公告)日: 2018-11-30
- 发明人: 喻梅 , 邓锐 , 徐天一 , 赵满坤 , 高洁 , 赵永伟
- 申请人: 天津大学
- 申请人地址: 天津市津南区海河教育园雅观路135号天津大学北洋园校区
- 专利权人: 天津大学
- 当前专利权人: 天津大学
- 当前专利权人地址: 天津市津南区海河教育园雅观路135号天津大学北洋园校区
- 代理机构: 天津市北洋有限责任专利代理事务所
- 代理商 杜文茹
- 主分类号: G06K9/62
- IPC分类号: G06K9/62 ; G16H50/20
摘要:
一种基于深度学习的不平衡数据的均衡采样及建模方法:取出数据集中多数类和少数类样本集合,并分别计数;对多数类样集合本进行多次K-Means聚类,得到R个聚类结果;采用基于关联矩阵的聚类融合算法,将R个聚类结果进行聚类融合,得到新的多数类样集合;对少数类样本集合进行过采样,得到新的少数类样本集合;将得到的新的多数类样集合和新的少数类样本集合相组合,形成类别平衡的新数据集;抽取类别平衡的新数据集的抽象特征,将抽象特征作为一个新的特征加入到类别平衡的新数据集的特征集中,形成新的特征集;采用得到的新的特征集训练DBN模型,得到最优DBN模型。本发明避免了单一处理方法中的缺点,有更好的处理能力,并且有较好的准确率。