敏感词的识别和替换方法及其装置
摘要:
本公开提出了一种敏感词的识别和替换方法及其装置,涉及自然语言处理技术领域。该方法包括:获取待处理文本,对待处理文本进行词语切分和命名实体识别,获取多个候选词语;采用基于词嵌入特征的第一深度学习模型对候选词语进行识别,判断候选词语中是否存在敏感词;响应于候选词语中存在敏感词,对敏感词进行词性标注和情感分析,获取敏感词的词性类型和情感类型;基于待处理文本、敏感词的词性类型和情感类型,从预设替换词库中确定目标替换词,并基于目标替换词对敏感词进行替换,获取替换敏感词之后的目标文本。本公开可以提高敏感词的识别和替换的灵活性,通过深度的语义理解,处理复杂的文本,提升敏感词过滤的准确性。
公开/授权文献
0/0