-
公开(公告)号:CN114021630A
公开(公告)日:2022-02-08
申请号:CN202111260818.3
申请日:2021-10-28
Applicant: 同济大学
Abstract: 本发明涉及一种面向类别不平衡数据集的序数回归问题解决方法,包括:获取数据集,构建神经网络,数据集包括多个样本,每个样本带有标签,标签用于表示样本所属的类别,神经网络的损失函数为weight kappa loss损失函数;自数据集中选择一个batch,将该batch的所有样本送入神经网络,神经网络的输出为各个样本属于各个类别的预测概率;基于神经网络的输出统计概率混淆矩阵,并计算概率混淆矩阵的两个边缘分布的距离;基于两个边缘分布的距离更新损失函数;计算网络误差,反向传播更新神经网络参数。与现有技术相比,本发明通过对边缘分布进行惩罚,解决了混淆矩阵的全零列问题,消除了某种类别无法被检出的严重后果,提升了神经网络模型的性能。
-
公开(公告)号:CN114021630B
公开(公告)日:2024-07-02
申请号:CN202111260818.3
申请日:2021-10-28
Applicant: 同济大学
IPC: G06F18/214 , G06N3/02 , G06F17/16
Abstract: 本发明涉及一种面向类别不平衡数据集的序数回归问题解决方法,包括:获取数据集,构建神经网络,数据集包括多个样本,每个样本带有标签,标签用于表示样本所属的类别,神经网络的损失函数为weight kappa loss损失函数;自数据集中选择一个batch,将该batch的所有样本送入神经网络,神经网络的输出为各个样本属于各个类别的预测概率;基于神经网络的输出统计概率混淆矩阵,并计算概率混淆矩阵的两个边缘分布的距离;基于两个边缘分布的距离更新损失函数;计算网络误差,反向传播更新神经网络参数。与现有技术相比,本发明通过对边缘分布进行惩罚,解决了混淆矩阵的全零列问题,消除了某种类别无法被检出的严重后果,提升了神经网络模型的性能。
-