发明授权
- 专利标题: 一种关键词提取方法和装置
-
申请号: CN201611086114.8申请日: 2016-11-30
-
公开(公告)号: CN106776546B公开(公告)日: 2019-10-15
- 发明人: 郭红艳 , 李博 , 张淑燕
- 申请人: 努比亚技术有限公司
- 申请人地址: 广东省深圳市南山区高新区北环大道9018号大族创新大厦A区6-8层、10-11层、B区6层、C区6-10层
- 专利权人: 努比亚技术有限公司
- 当前专利权人: 努比亚技术有限公司
- 当前专利权人地址: 广东省深圳市南山区高新区北环大道9018号大族创新大厦A区6-8层、10-11层、B区6层、C区6-10层
- 代理机构: 深圳协成知识产权代理事务所
- 代理商 章小燕
- 主分类号: G06F17/27
- IPC分类号: G06F17/27
摘要:
本发明实施例公开了一种关键词提取方法及装置,所述方法包括:根据预设规则获取待处理的文本的分词集合,所述分词集合中至少包括第一至第N分词;确定所述分词集合中第i分词的网页级别PR值;确定所述分词集合中两两分词之间的编码距离;获取第一编码距离集合,所述第一编码距离集合包括第i分词与除所述第i分词外其他分词之间的编码距离;根据第一编码距离集合和所述第i分词对应的第i阈值确定所述第i分词的关联度;根据所述第i分词的PR值和所述第i分词的关联度确定所述第i分词的关键度;根据所述第一至第N分词的关键度确定所述待处理的文本的关键词。采用本发明实施例的技术方案,能够解决在关键词提取过程中对出现频率不高的关键词提取不准确的问题。
公开/授权文献
- CN106776546A 一种关键词提取方法和装置 公开/授权日:2017-05-31