-
公开(公告)号:CN118643153A
公开(公告)日:2024-09-13
申请号:CN202410785871.2
申请日:2024-06-18
Applicant: 兰州大学
IPC: G06F16/35 , G06F16/332 , G06F16/33 , G06F40/30 , G06F18/2415 , G06F18/213 , G06N3/047 , G06N3/0442 , G06N3/049 , G06N3/084 , G06N3/096
Abstract: 本发明提供了一种基于迁移学习的长文本分类方法,属于文本自动分类技术领域,包括以下步骤:基于覆盖分割和层级位置编码对长文本序列进行编码,获得多文本编码;将所述多文本编码输入到并行的预训练语言模型中,获得多文本特征;将所述多文本特征输入到层级注意力模型中,获得长文本特征;基于长文本特征通过全连接网络层对文本进行分类,获得长文本分类结果。本发明可以有效进行文本分类,并提高长文本分类的准确率。