一种基于互信息和改进遗传算法的用户属性特征选择方法

    公开(公告)号:CN112906890A

    公开(公告)日:2021-06-04

    申请号:CN202110292490.7

    申请日:2021-03-18

    Abstract: 本发明公开了一种基于互信息和改进遗传算法的用户属性特征选择方法,属于机器学习领域,具体包括:首先,对各手机用户设置标签并统计用户特征,对每个标签和对应的各个特征之间计算互信息;接着,按照互信息由大到小的顺序进行排序,并筛选互信息大于阈值的特征到初始种群中;同时,在初始种群中随机生成若干特征并赋值;然后,对特征进行编码形成个体并计算每个个体的适应度;利用轮盘赌的比例选择法,按照适应度值计算个体的选择概率,对于选中进入下一代遗传操作的个体,进行交叉、变异操作,产生新一代种群;重复计算新一代种群中个体的适应度,直至终止输出最优特征子集;本发明快速得到最优特征子集,删除了部分冗余特征,分类效果明显。

    一种基于集成学习的用户基础属性预测方法

    公开(公告)号:CN111291798B

    公开(公告)日:2021-04-20

    申请号:CN202010070270.5

    申请日:2020-01-21

    Abstract: 本发明涉及一种基于集成学习的用户基础属性预测方法,该方法通过分析移动用户的App安装及使用数据,预测用户的年龄和性别。首先将多分类问题转化为多个二分类问题,利用LightGBM和FM融合模型作为二分类器进行二分类预测;然后把二分类的预测结果与原始特征合并,构建多分类模型。实验结果表明,本发明提出的融合方法能够提高用户属性预测的效果。

    一种基于集成学习的用户基础属性预测方法

    公开(公告)号:CN111291798A

    公开(公告)日:2020-06-16

    申请号:CN202010070270.5

    申请日:2020-01-21

    Abstract: 本发明涉及一种基于集成学习的用户基础属性预测方法,该方法通过分析移动用户的App安装及使用数据,预测用户的年龄和性别。首先将多分类问题转化为多个二分类问题,利用LightGBM和FM融合模型作为二分类器进行二分类预测;然后把二分类的预测结果与原始特征合并,构建多分类模型。实验结果表明,本发明提出的融合方法能够提高用户属性预测的效果。

Patent Agency Ranking