文本处理方法、装置、电子设备及计算机可读存储介质

发明公开

CN113011126A 文本处理方法、装置、电子设备及计算机可读存储介质审中-实审

请登陆查看更多内容

专利标题： 文本处理方法、装置、电子设备及计算机可读存储介质
申请号： CN202110265746.5

申请日： 2021-03-11
公开(公告)号： CN113011126A

公开(公告)日： 2021-06-22
发明人: 刘刚
申请人： 腾讯科技(深圳)有限公司
申请人地址： 广东省深圳市南山区高新区科技中一路腾讯大厦35层
专利权人： 腾讯科技(深圳)有限公司
当前专利权人： 腾讯科技(深圳)有限公司
当前专利权人地址： 广东省深圳市南山区高新区科技中一路腾讯大厦35层
代理机构： 北京市立方律师事务所
代理商 张筱宁
主分类号： G06F40/10
IPC分类号： G06F40/10 ; G06F40/30 ; G06F40/211 ; G06N20/00

摘要：

本申请实施例提供了一种文本处理方法、装置、电子设备及计算机可读存储介质，涉及人工智能、自然语言处理、文本处理及云技术领域。该方法包括：通过调用训练好的第一文本处理模型对第一待处理文本进行处理，该模型是通过以下方式训练得到的：获取多个第一文本，将每个第一文本中包含的至少一个字符进行替换，得到各第一文本对应的第二文本；基于各第一文本和各第二文本，对初始特征提取模块进行训练，得到预训练后的特征提取模块，基于第二训练数据对预训练后的特征提取模块和初始文本处理模块进行训练，得到第一文本处理模型。本方案中，由于将第一文本中的字符替换，以使模型主动学习字符间的上下文信息，从而提高了模型的精度。

公开/授权文献

CN113011126B 文本处理方法、装置、电子设备及计算机可读存储介质公开/授权日：2023-06-30

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F40/00	处理自然语言数据（语音分析或综合，语音识别G10L）
G06F40/10	.文本处理（自然语言分析G06F 40/20;语义分析G06F 40/30;自然语言处理或翻译G06F 40/40）