一种基于预训练语言模型的文本分类方法及装置
摘要:
本发明提供一种基于预训练语言模型的文本分类方法及装置,涉及内容理解技术领域,所述方法包括:获取文本分类类别和待分类文本,并使用预训练语言模型进行预测,以得到每个分类的关键词;对待分类文本进行分词,并使用预训练语言模型进行预测,以得到分类指示性词;使用分类指示性词训练分类模型,以得到训练后分类模型;使用训练后分类模型进行文本分类,以得到分类结果。本发明提供一种基于预训练语言模型的文本分类方法及装置,解决数据治理过程中,用户在对文本进行分类时无法提供所有文档类别,同时也无法提供每个类别的足够样本用于机器训练的问题。
0/0