网络文本处理方法及装置
摘要:
本发明公开了一种网络文本处理方法及装置。该网络文本处理方法包括:获取待分析的网络文本;获取预设词汇集合;按照多个预设词汇的长度由长到短的顺序,依次判断多个预设词汇是否出现在网络文本中,其中,依次判断多个预设词汇是否出现在网络文本中包括:判断第一预设词汇是否出现在网络文本中,如果第一预设词汇出现在网络文本中,在判断第二预设词汇是否出现在网络文本中时,忽略网络文本中与第一预设词汇相同的词汇;获取网络文本中与第一预设词汇和第二预设词汇相同的词汇。通过本发明,在网络文本处理过程中有效避免了文本词汇重复匹配问题,并且提高了文本词汇的匹配效率。
公开/授权文献
0/0