一种基于样本筛选与标签矫正的噪声数据集训练方法

    公开(公告)号:CN115641480A

    公开(公告)日:2023-01-24

    申请号:CN202211392565.X

    申请日:2022-11-08

    Abstract: 本发明公开了一种基于样本筛选与标签矫正的噪声数据集训练方法,属于深度学习、卷积神经网络和噪声数据集训练领域,具体地说是一种基于样本筛选与标签矫正的噪声数据集训练方法。提出了一种新的样本筛选策略,其利用基于类级特征的聚类过程来识别在特征空间中靠近其对应类中心的干净样本。该方法还提出了采用一种新的标签矫正策略,将训练标签重建为当前训练标签、特征标签以及预测标签结果的加权组合,随着训练的进行,可以将噪声标签逐渐纠正为正确的标签,这增加了干净的可用于训练的样本数量,降低了训练集的噪声强度,提高了模型的精度与鲁棒性。

Patent Agency Ranking