一种针对Mixup数据增强的长尾数据处理方法及装置
摘要:
本发明公开了一种针对Mixup数据增强的长尾数据处理方法及装置,方法包括:输入N对原始长尾数据集图片及其对应标签;通过模拟Beta分布得到一个服从Beta分布的参数θ,基于参数θ使用Mixup按比例结合两个样本,生成新样本;将新样本作为模型的输入,得到输出;基于θ计算使用Mixup后的类间间隔;将变换后的类间间隔应用到空间变换间隔损失函数,计算总损失并更新模型参数,完成模型的训练;利用训练好的模型对长尾分布的图像数据进行分类识别。本发明利用参数θ变换类间间隔,解决了长尾数据集中的重平衡损失函数与使用Mixup后收缩的类间间隔不匹配的问题,提高图像识别精度。
0/0