-
公开(公告)号:CN104268292B
公开(公告)日:2018-03-16
申请号:CN201410572863.6
申请日:2014-10-23
Applicant: 广州智索信息科技有限公司
IPC: G06F17/30
Abstract: 本发明涉及画像系统的标签词库更新方法,其包括:获取用户的画像数据,所述画像数据包括用于描述所述用户的标签和所述用户发表的原始文本;当标签的数量与原始文本的数量的比值小于预设的第一阈值时,对所述用户发表的所有原始文本进行分词处理,以得到多个标签候选词,并将标签候选词发送至推荐系统;推荐系统计算每一个标签候选词与预设的词向量模型文件中每一个词的向量距离,将存在向量距离大于预设的第二阈值的标签候选词加入到标签词库中,将不存在向量距离大于第二阈值的标签候选词删除。本发明能够及时对标签词库进行更新,以更好地对用户进行描述。