发明授权
- 专利标题: 网络文本处理方法及装置
-
申请号: CN201410564652.8申请日: 2014-10-21
-
公开(公告)号: CN104317883B公开(公告)日: 2017-11-21
- 发明人: 何鑫 , 侯明午
- 申请人: 北京国双科技有限公司
- 申请人地址: 北京市海淀区双榆树小区知春路76号翠宫饭店8层A间
- 专利权人: 北京国双科技有限公司
- 当前专利权人: 北京国双科技有限公司
- 当前专利权人地址: 北京市海淀区双榆树小区知春路76号翠宫饭店8层A间
- 代理机构: 北京康信知识产权代理有限责任公司
- 代理商 李志刚; 吴贵明
- 主分类号: G06F17/30
- IPC分类号: G06F17/30
摘要:
本发明公开了一种网络文本处理方法及装置。该网络文本处理方法包括:获取待分析的网络文本;获取预设词汇集合;按照多个预设词汇的长度由长到短的顺序,依次判断多个预设词汇是否出现在网络文本中,其中,依次判断多个预设词汇是否出现在网络文本中包括:判断第一预设词汇是否出现在网络文本中,如果第一预设词汇出现在网络文本中,在判断第二预设词汇是否出现在网络文本中时,忽略网络文本中与第一预设词汇相同的词汇;获取网络文本中与第一预设词汇和第二预设词汇相同的词汇。通过本发明,在网络文本处理过程中有效避免了文本词汇重复匹配问题,并且提高了文本词汇的匹配效率。
公开/授权文献
- CN104317883A 网络文本处理方法及装置 公开/授权日:2015-01-28