-
公开(公告)号:CN106649267A
公开(公告)日:2017-05-10
申请号:CN201611076366.2
申请日:2016-11-30
Applicant: 北京邮电大学
Abstract: 本发明提供一种通过文本主题挖掘推测用户大五人格的方法及系统。所述方法包括:S1,采集文本数据及大五人格评分,进行预处理;S2,基于人格‑主题模型,根据预处理后的文本获得人格‑主题分布矩阵;S3,根据人格‑主题分布矩阵分析人格与主题关系获得不同主题关联的大五人格得分。本发明建立了一个全新的基于开放词表的主题模型,在心理学中大五人格理论的支撑下,结合用户大五人格标签,使训练样本通过模型作用得到用户主题分布与人格类型的关系,针对主题模型输出的数据结果,寻找有效的数据处理方案和评定方法,对主题与人格的关系进行量化分析,从而实现用户人格预测。