-
公开(公告)号:CN104268292B
公开(公告)日:2018-03-16
申请号:CN201410572863.6
申请日:2014-10-23
Applicant: 广州智索信息科技有限公司
IPC: G06F17/30
Abstract: 本发明涉及画像系统的标签词库更新方法,其包括:获取用户的画像数据,所述画像数据包括用于描述所述用户的标签和所述用户发表的原始文本;当标签的数量与原始文本的数量的比值小于预设的第一阈值时,对所述用户发表的所有原始文本进行分词处理,以得到多个标签候选词,并将标签候选词发送至推荐系统;推荐系统计算每一个标签候选词与预设的词向量模型文件中每一个词的向量距离,将存在向量距离大于预设的第二阈值的标签候选词加入到标签词库中,将不存在向量距离大于第二阈值的标签候选词删除。本发明能够及时对标签词库进行更新,以更好地对用户进行描述。
-
公开(公告)号:CN106447503A
公开(公告)日:2017-02-22
申请号:CN201610777592.7
申请日:2016-08-30
Applicant: 广州智索信息科技有限公司
CPC classification number: G06Q50/01 , G06F16/221 , G06F16/2465 , G06F16/27 , G06F2216/03
Abstract: 本发明涉及社交网络领域,具体涉及一种基于Map Reduce的大型网络图中寻找公共联系人及其路径的计算方法,所述计算方法通过Map Reduce运行机制,结合跳级原则(Mapper)和合并原则(Reducer),建立在大型网络图或社交网络中寻找目标群体在若干跳数内的所有公共联系人及其最短联系路径的分布式计算框架,计算所述目标群体到所述公共联系人之间的最短路径,记录并存储于数据库中。本发明成功地将Map模型和Reduce模型结合在一起,实现了目标群体任意节点到该公共联系人之间的最短路径计算和记录;提出了一种效率较高的最短路径优化计算方法,为社交网络的进一步推进发展提供了一种新的算法推进思路。
-