发明授权
- 专利标题: 敏感词的识别和替换方法及其装置
-
申请号: CN202410418406.5申请日: 2024-04-09
-
公开(公告)号: CN118013963B公开(公告)日: 2024-06-21
- 发明人: 任兴 , 钱建锋
- 申请人: 四川易景智能终端有限公司
- 申请人地址: 四川省宜宾市临港经开区牌坊路105号易景智能终端产业园项目2幢
- 专利权人: 四川易景智能终端有限公司
- 当前专利权人: 四川易景智能终端有限公司
- 当前专利权人地址: 四川省宜宾市临港经开区牌坊路105号易景智能终端产业园项目2幢
- 代理机构: 北京清亦华知识产权代理事务所
- 代理商 石茵汀
- 主分类号: G06F40/284
- IPC分类号: G06F40/284 ; G06F40/30 ; G06F40/166 ; G06F40/151
摘要:
本公开提出了一种敏感词的识别和替换方法及其装置,涉及自然语言处理技术领域。该方法包括:获取待处理文本,对待处理文本进行词语切分和命名实体识别,获取多个候选词语;采用基于词嵌入特征的第一深度学习模型对候选词语进行识别,判断候选词语中是否存在敏感词;响应于候选词语中存在敏感词,对敏感词进行词性标注和情感分析,获取敏感词的词性类型和情感类型;基于待处理文本、敏感词的词性类型和情感类型,从预设替换词库中确定目标替换词,并基于目标替换词对敏感词进行替换,获取替换敏感词之后的目标文本。本公开可以提高敏感词的识别和替换的灵活性,通过深度的语义理解,处理复杂的文本,提升敏感词过滤的准确性。
公开/授权文献
- CN118013963A 敏感词的识别和替换方法及其装置 公开/授权日:2024-05-10