文本转换模型的训练方法、非结构化文本数据的处理方法和装置

    公开(公告)号:CN117874293A

    公开(公告)日:2024-04-12

    申请号:CN202410024477.7

    申请日:2024-01-05

    Abstract: 本申请提出一种文本转换模型的训练方法、非结构化文本数据的处理方法和装置,其中,具体的实施方案为:获取预训练好的文本转换模型,其中,文本转换模型是基于通用领域下的非结构化文本和对应的结构化文本训练得到的;获取目标业务领域下的非结构化文本样本;对非结构化文本样本进行结构化处理,以得到非结构化文本样本对应的结构化文本样本;根据非结构化文本样本以及对应的结构化文本样本,对文本转换模型进行训练,以得到适配于目标业务领域的目标文本转换模型,由此,基于预训练好的文本转换模型,无需大量的非结构化文本训练数据,即可得到适配于目标业务领域的目标文本转换模型,提高了目标文本转换模型进行文本转换的准确率。

Patent Agency Ranking