-
公开(公告)号:CN113283578A
公开(公告)日:2021-08-20
申请号:CN202110399544.X
申请日:2021-04-14
Applicant: 南京大学
Abstract: 本发明公开一种基于标记风险控制的数据去噪方法,数据深度学习的成功往往依赖于大量有准确标记的数据,但是实际场景中通常很难收集到大量标记准确的数据。为了减少数据标记噪声对神经网络性能的影响,本发明方法中维护两个神经网络互相选择损失小的数据作为低风险数据给对等网络进行更新,每个网络分别过滤掉其中的高风险数据并在剩下的数据上重新训练。随着训练的进行两个网络会越来越相似导致学习性能退化,为了解决这一问题,当两个神经网络的不一致性达到稳定时停止互相选择数据,利用得到的低风险数据更新网络直到收敛。相比现有技术,本发明使深度神经网络具有更强的鲁棒性。
-
公开(公告)号:CN106934055A
公开(公告)日:2017-07-07
申请号:CN201710163950.X
申请日:2017-03-20
Applicant: 南京大学
Abstract: 本发明公开了一种基于不充分模态信息的半监督网页自动分类方法,基于加权协同训练算法,在训练分类器的过程中给数据分配不同的权值。本发明方法能够减少由于不充分模态特征引起的数据不一致性对分类过程所带来的影响,从而具有更好的分类精度与更强的鲁棒性。此外,本发明方法仅需要少量的有标记训练数据,能够利用未标记数据的信息,因而可用于标记训练数据匮乏的场景。
-