标签分类方法、装置、设备和存储介质

    公开(公告)号:CN114358017A

    公开(公告)日:2022-04-15

    申请号:CN202111632633.0

    申请日:2021-12-28

    Abstract: 本申请提供了一种标签分类方法、装置、设备和存储介质,所述方法通过各门学科数据对应的大量源域无标签样本训练生成用于识别各门学科数据语义信息的预训练的语言模型,减少了人工标注时间,然后将源域训练好的语言模型迁移学习至目标域,即可通过语言模型对目标学科数据的目标域标签样本进行语义提取,无需大量目标学科数据训练标签分类模型,通过提取的目标域标签样本语义信息对模型标签分类模型的分类参数进行训练,对标签分类模型的微调,即可生成对目标学科进行标签分类的目标标签分类模型,不仅提高了标签分类模型的训练效率,而且提高了目标学科的数据分类效率,降低了标签分类成本。

Patent Agency Ranking