基于层自编码器的多源用户属性推断方法

    公开(公告)号:CN110990715A

    公开(公告)日:2020-04-10

    申请号:CN201911112845.9

    申请日:2019-11-14

    Abstract: 本发明提供了一种基于层自编码器的多源用户属性推断方法。该方法包括:从用户在多个社交媒体上发布的动态信息中提取用户的行为特征;通过最小化重构误差和同一用户不同社交媒体上动态行为特征映射到同一人口属性空间的差异,所述层自编码器利用非线性映射输出用户的稳定的人口属性特征;针对每个用户的稳定的人口属性特征训练一个分类器,通过所述分类器对每个用户的人口属性特征进行分类。本发明用多源的异构信息有利于寻找不同社交媒体上的共享模式。利用层自编码器更精确地建模动态行为和稳定人口属性之间的关系。使用大量的未标注的数据,相比于有标注的数据,省时省力,降低对数据的要求,从而提高分类器对用户属性推断的准确率。

    基于层自编码器的多源用户属性推断方法

    公开(公告)号:CN110990715B

    公开(公告)日:2023-06-06

    申请号:CN201911112845.9

    申请日:2019-11-14

    Abstract: 本发明提供了一种基于层自编码器的多源用户属性推断方法。该方法包括:从用户在多个社交媒体上发布的动态信息中提取用户的行为特征;通过最小化重构误差和同一用户不同社交媒体上动态行为特征映射到同一人口属性空间的差异,所述层自编码器利用非线性映射输出用户的稳定的人口属性特征;针对每个用户的稳定的人口属性特征训练一个分类器,通过所述分类器对每个用户的人口属性特征进行分类。本发明用多源的异构信息有利于寻找不同社交媒体上的共享模式。利用层自编码器更精确地建模动态行为和稳定人口属性之间的关系。使用大量的未标注的数据,相比于有标注的数据,省时省力,降低对数据的要求,从而提高分类器对用户属性推断的准确率。

Patent Agency Ranking