发明授权
- 专利标题: 一种多层次自然语言反垃圾文本方法及系统
-
申请号: CN201910266548.3申请日: 2019-04-03
-
公开(公告)号: CN109977416B公开(公告)日: 2023-07-25
- 发明人: 叶志豪 , 刘冶 , 桂进军 , 李宏浩 , 印鉴
- 申请人: 中山大学 , 广州赫炎大数据科技有限公司
- 申请人地址: 广东省广州市海珠区新港西路135号;
- 专利权人: 中山大学,广州赫炎大数据科技有限公司
- 当前专利权人: 中山大学,广州赫炎大数据科技有限公司
- 当前专利权人地址: 广东省广州市海珠区新港西路135号;
- 代理机构: 广州骏思知识产权代理有限公司
- 代理商 吴静芝
- 主分类号: G06F40/284
- IPC分类号: G06F40/284 ; G06F40/30 ; G06F16/33 ; G06F16/35 ; G06F16/903
摘要:
本发明涉及一种多层次自然语言反垃圾文本方法及系统,通过获得待识别文本的敏感词识别结果、敏感词变形体识别结果,并结合对待识别文本进行文本分类得到其为垃圾文本的预判概率,基于对所述敏感词识别结果、敏感词变形体识别结果和预判概率进行综合评判,得出所述待识别文本为垃圾文本的最终概率。本发明能高效地识别垃圾文本,能避免垃圾文本对互联网健康交流环境的不利影响,有较高的稳健性,可广泛地适用于社交、评论等互联网产品。
公开/授权文献
- CN109977416A 一种多层次自然语言反垃圾文本方法及系统 公开/授权日:2019-07-05