-
公开(公告)号:CN111966951A
公开(公告)日:2020-11-20
申请号:CN202010639118.4
申请日:2020-07-06
Applicant: 东南数字经济发展研究院
Abstract: 本发明提供了一种基于社交电商交易数据的用户群体阶层划分方法,它解决了现有操作复杂精准度不高的问题。其方法包括:步骤S1:取单位时间段内的平台使用天数、日均交易笔数、平均单笔建议金额和平均每天使用时长;步骤S2:对S1中数据进行0-1规格化处理;步骤S3:将S2得到的纯数值采用聚类算法计算,步骤S4:以k值为x轴,SSE值为y轴建立二维坐标系。以坐标系上k值的最小和最大值对应的两点确定直线L。对每个k值对应的点计算其到直线L的垂直距离,选择距离最长的点对应的k值为最终为社交电商用户群体按照交易数据划分的阶层数。本发明优点在于更为精准便捷的进行阶层划分。
-
公开(公告)号:CN111858930A
公开(公告)日:2020-10-30
申请号:CN202010639145.1
申请日:2020-07-06
Applicant: 东南数字经济发展研究院
Abstract: 本发明提供了一种社交电商用户画像的建立方法,它解决了现有技术存在的干扰噪音多的问题。其方法包括:步骤S1:在中文语料库中进行自监督训练得到预训练模型;步骤S2:对社交电商公开文本数据集预处理后进行分类标注;步骤S3:将预训练模型在类别标注完成的数据集上进行微调训练,得到用户画像模型。本发明优点在于有效减少干扰噪音,合理使用社交电商专业领域文本信息,提升用户画像建立的精准度。
-