-
公开(公告)号:CN117874015A
公开(公告)日:2024-04-12
申请号:CN202410054612.2
申请日:2024-01-12
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/215 , G06F16/583 , G06F16/58 , G06F40/126 , G06F40/194 , G06F18/214
Abstract: 本发明提供一种数据清洗方法、装置、电子设备及存储介质。该方法包括:获取目标数据集;根据目标数据集中所包括的类别确定类别约束条件;并将目标数据集划分为多个子数据集;针对任意一个子数据集执行以下步骤:将该子数据集作为待清洗子数据集,其他子数据集作为训练集;基于训练集训练前置视觉语言模型;将待清洗子数据集中的图像和类别约束条件输入到前置视觉语言模型中,得到待清洗子数据集中图像的伪标签;将待清洗子数据集中的图像、标签和伪标签作为三元组输入到后置视觉语言模型,输出待清洗子数据集中图像的判定结果;根据判定结果,对待清洗子数据集进行清洗操作。本发明能够有效识别标注错误,多类别标注不齐,无明显类别主体等问题。
-
公开(公告)号:CN118115795A
公开(公告)日:2024-05-31
申请号:CN202410242631.8
申请日:2024-03-04
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/764 , G06V10/774 , G06T7/00 , G06V10/82 , G06N3/0464
Abstract: 本申请提供了电子元器件分类方法、设备及存储介质,该方法包括:获取已标注的图像和未标注的图像,并将已标注的图像划分为训练集和测试集;基于训练集和测试集训练多个不同类型的神经网络模型,得到多个电子元器件分类模型,并将其划分为主模型和副模型;分别通过主模型和副模型在未标注的图像中筛选,筛选得到第一样本集合和第二样本集合;基于第一样本集合和第二样本集合,得到目标样本集合;将目标样本集合加入训练集中,重新训练主模型和副模型,检验重新训练后的主模型的分类准确率是否满足预设条件,若满足预设条件,则通过重新训练后的主模型对电子元器件进行分类。本申请能够提高综合区分良品以及不同类型的不良品的能力。
-