一种在不平衡分类场景下无分割的验证集合成方法

    公开(公告)号:CN117435896A

    公开(公告)日:2024-01-23

    申请号:CN202311353191.5

    申请日:2023-10-18

    Applicant: 浙江大学

    Abstract: 本发明公开了一种在不平衡分类场景下无分割的验证集合成方法,包括:对训练数据全集数据增强合成辅助集;利用表征模型对训练数据全集和辅助集中的样本进行特征提取得到特征向量;从辅助集中筛选K1个样本作为验证初始集;计算训练数据全集中各类别的类中心特征向量,并计算训练数据全集、辅助集、初始集的类内各样本与每一类中心特征向量的夹角;获取夹角的分布函数,对分布函数进行采样,得到夹角值集合;删除夹角值集合中验证初始集的类内各样本与每一类中心特征向量的夹角;计算辅助集的类内各样本与每一类中心特征向量的夹角与夹角值集合中的每一夹角的夹角距离,从辅助集中选取前K2个夹角距离最小的样本和验证初始集组成验证集。

Patent Agency Ranking