一种多层次自然语言反垃圾文本方法及系统
摘要:
本发明涉及一种多层次自然语言反垃圾文本方法及系统,通过获得待识别文本的敏感词识别结果、敏感词变形体识别结果,并结合对待识别文本进行文本分类得到其为垃圾文本的预判概率,基于对所述敏感词识别结果、敏感词变形体识别结果和预判概率进行综合评判,得出所述待识别文本为垃圾文本的最终概率。本发明能高效地识别垃圾文本,能避免垃圾文本对互联网健康交流环境的不利影响,有较高的稳健性,可广泛地适用于社交、评论等互联网产品。
公开/授权文献
0/0