-
公开(公告)号:CN115292483A
公开(公告)日:2022-11-04
申请号:CN202210288840.7
申请日:2022-03-23
Applicant: 北京交通大学
IPC: G06F16/35 , G06F16/36 , G06N3/04 , G06F40/295 , G06F40/30
Abstract: 本发明公开一种基于不确定性感知异质图注意力网络的短文本分类方法。该方法包括:获取有标签数据集和无标签数据集,其中有标签数据的数量少于无标签数据;基于所述有标签数据集训练异质图注意力网络模型;利用经训练的异质图注意力网络模型对所述无标签数据集进行预测,并计算预测结果的不确定性值;利用预测值和所述不确定性值同时作为置信度,对所述无标签数据集打伪标签,并选择出正负样本伪标签;混合所选择的伪标签数据和所述有标签数据集,获得混合数据集,利用该混合数据集对所述异质图注意力网络模型进一步训练;重复上述步骤,直到满足设定的终止条件。本发明能够在低数据源的情况下,准确对常见的短文本进行分类。