一种面向文本信息的敏感词过滤方法
摘要:
本发明公开了一种面向文本信息的敏感词过滤方法,包括以下步骤:(1)接收用户的文本信息,验证文本信息的数据格式是否正确,若数据格式验证不通过,则回到步骤(1);若通过验证,则转至步骤(2);(2)对文本信息进行语义分析:从文本信息中取出一个词组,在语义分析库中进行匹配,得到词组的词重;按照词重对文本信息的所有词组重新排序,然后将排序后的文本信息转换成数组格式;(3)对数组格式的文本信息进行敏感词过滤;如果有敏感词存在,将匹配出的敏感词返回给用户;如果不存在,返回给用户一个空信息。本发明不仅对敏感词进行词重分类,并且对分完类的敏感词又按照字母类别分类,有效提高了敏感词的过滤速度。
公开/授权文献
0/0