发明公开
- 专利标题: 文本处理方法、装置、电子设备及计算机可读存储介质
-
申请号: CN202110265746.5申请日: 2021-03-11
-
公开(公告)号: CN113011126A公开(公告)日: 2021-06-22
- 发明人: 刘刚
- 申请人: 腾讯科技(深圳)有限公司
- 申请人地址: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人地址: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 代理机构: 北京市立方律师事务所
- 代理商 张筱宁
- 主分类号: G06F40/10
- IPC分类号: G06F40/10 ; G06F40/30 ; G06F40/211 ; G06N20/00
摘要:
本申请实施例提供了一种文本处理方法、装置、电子设备及计算机可读存储介质,涉及人工智能、自然语言处理、文本处理及云技术领域。该方法包括:通过调用训练好的第一文本处理模型对第一待处理文本进行处理,该模型是通过以下方式训练得到的:获取多个第一文本,将每个第一文本中包含的至少一个字符进行替换,得到各第一文本对应的第二文本;基于各第一文本和各第二文本,对初始特征提取模块进行训练,得到预训练后的特征提取模块,基于第二训练数据对预训练后的特征提取模块和初始文本处理模块进行训练,得到第一文本处理模型。本方案中,由于将第一文本中的字符替换,以使模型主动学习字符间的上下文信息,从而提高了模型的精度。
公开/授权文献
- CN113011126B 文本处理方法、装置、电子设备及计算机可读存储介质 公开/授权日:2023-06-30