发明授权
- 专利标题: 词权重生成方法和装置
-
申请号: CN201410650467.0申请日: 2014-11-14
-
公开(公告)号: CN105653553B公开(公告)日: 2020-04-03
- 发明人: 赵琳 , 王迪 , 周连强
- 申请人: 腾讯科技(深圳)有限公司
- 申请人地址: 广东省深圳市福田区振兴路赛格科技园2栋东403室
- 专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人地址: 广东省深圳市福田区振兴路赛格科技园2栋东403室
- 代理机构: 广州华进联合专利商标代理有限公司
- 代理商 何平; 邓云鹏
- 主分类号: G06F16/33
- IPC分类号: G06F16/33 ; G06F16/9535 ; G06F40/289
摘要:
本发明提供了一种词权重生成方法和装置,该方法包括:获取待处理查询串;对所述待处理查询串进行分词处理以获得待处理切分词;将所述待处理切分词和连续多个所述待处理切分词的顺序组合形成待处理词片段的集合;获取所述待处理切分词相对于每个包含该待处理切分词的所述待处理词片段的预训练词权重;根据所述获取的预训练词权重计算出所述待处理切分词相对于所述待处理查询串的拟合词权重。本发明提供的词权重生成方法和装置,考虑了待处理查询串中各个词在该待处理查询串中的词权重,能够准确反映出用户的检索需求,利用该拟合词权重对检索结果排序后使得检索结果更加贴近检索需求,提升检索准确性以及效率。
公开/授权文献
- CN105653553A 词权重生成方法和装置 公开/授权日:2016-06-08