一种标签生成方法、装置、电子设备及存储介质

    公开(公告)号:CN117152571A

    公开(公告)日:2023-12-01

    申请号:CN202311021873.6

    申请日:2023-08-14

    Abstract: 本申请实施例提供了一种标签生成方法、装置、电子设备及存储介质,涉及机器学习技术领域,方法包括:将每一无标签数据输入至基于有标签数据训练得到的模型,得到表示该无标签数据属于各预设类别的概率的第一预测标签;基于无标签数据的数据特征和第一预测标签,对无标签数据进行聚类得到第一聚类簇,以及基于有标签数据的数据特征和真值标签,对有标签数据进行聚类得到第二聚类簇;针对每一第一聚类簇,基于该第一聚类簇与每一聚类簇集合之间的特征距离,得到表示该第一聚类簇属于每一预设类别的概率的第二预测标签;对每一无标签数据的第一预测标签和第二预测标签进行融合得到融合标签,并得到最终的标签。如此,可以生成无标签数据有效的标签。

Patent Agency Ranking