一种训练用户分类模型的方法及装置

    公开(公告)号:CN120067842A

    公开(公告)日:2025-05-30

    申请号:CN202510220527.3

    申请日:2025-02-26

    Abstract: 本说明书实施例提供了一种训练用户分类模型的方法,包括:获取基于预训练模型分别初始化的第一分类模型、第二分类模型。利用第一分类模型,对用户集的第一子集中各用户进行类簇预测,得到类簇伪标签;以及,利用第二分类模型,对各用户进行M个用户群体的分类预测,得到分类伪标签。根据各用户的类簇伪标签和分类伪标签,从第一子集中确定出未知类别的第一用户。利用第一/第二分类模型,分别对该第一用户的增强样本进行预测,得到第一/第二预测结果;以第一预测结果接近该第一用户的类簇伪标签为目标,对第一分类模型进行更新;以第二预测结果中对应于M个用户群体的预测概率之和最大化为目标,对第二分类模型进行更新。

    一种利用混合无标记数据的半监督域泛化故障检测方法

    公开(公告)号:CN117556301A

    公开(公告)日:2024-02-13

    申请号:CN202311570546.6

    申请日:2023-11-23

    Applicant: 南京大学

    Inventor: 王魏 张磊 李济孚

    Abstract: 本发明公开一种利用混合无标记数据的半监督域泛化故障检测方法,首先用户需要准备好若干个来自不同域的故障检测对象库,通过人工标注的方法为每个库中的少量对象提供类别标记,这些有类别标记的对象称为有标记训练数据,其组成的类别空间称为已知类;其余没有类别标记的对象称为无标记训练数据,其真实类别可能与有标记训练数据的类别相同,也有可能不同,与有标记训练数据不同的类别称为未知类。然后通过利用一对其余分类模型,逐类自适应置信度阈值以及一致性正则等技术,有效地将无标记训练数据中的已知类以及未知类样本区分开来,更加精细化地分别利用已知类和未知类样本进行训练,提高故障检测的准确度。

Patent Agency Ranking