一种关键词提取方法和装置
摘要:
本发明实施例公开了一种关键词提取方法及装置,所述方法包括:根据预设规则获取待处理的文本的分词集合,所述分词集合中至少包括第一至第N分词;确定所述分词集合中第i分词的网页级别PR值;确定所述分词集合中两两分词之间的编码距离;获取第一编码距离集合,所述第一编码距离集合包括第i分词与除所述第i分词外其他分词之间的编码距离;根据第一编码距离集合和所述第i分词对应的第i阈值确定所述第i分词的关联度;根据所述第i分词的PR值和所述第i分词的关联度确定所述第i分词的关键度;根据所述第一至第N分词的关键度确定所述待处理的文本的关键词。采用本发明实施例的技术方案,能够解决在关键词提取过程中对出现频率不高的关键词提取不准确的问题。
公开/授权文献
0/0